Son Haberler
Buradasınız: Anasayfa / Bilişim / Tekilleştirmenin Yedekleme Ekonomisinde Yaratmakta Olduğu Devrim Bölüm 2 | Tuzla Bilgisayar
Tekilleştirmenin Yedekleme Ekonomisinde Yaratmakta Olduğu Devrim Bölüm 2 | Tuzla Bilgisayar

Tekilleştirmenin Yedekleme Ekonomisinde Yaratmakta Olduğu Devrim Bölüm 2 | Tuzla Bilgisayar

Yedekleme ve Arşiv Amaçlı Tekilleştirme Sistemlerinde En Önemli Kriterler:

Bugün verilerinizi tekilleştirerek yedekleyecek/arşivleyecek bir teknolojiye yatırım yapacak olsanız öncelikle hangi kriterleri değerlendirmeye almalısınız?  Tekilleştirme sistemlerinde temel amaç en az kapasite ile en fazla veriyi depolayabilmektir. Bunu gerçekleştirirken asıl önemli olan ise verinin ne oranla tekilleştirildiğinin ötesinde, elinizdeki sistemin  tekilleştirme işlemini ne kadar GÜVENLİ  ve yüksek PERFORMANS ile yaptığıdır. Performans ve Güvenliğin yanı sıra sisteminizin birden fazla protokolü destekleyebilmesi, replikasyon sırasında gösterebildiği esneklik, diğer önemli kriterler olarak sıralanabilir. Şimdi bu kriterleri detaylı olarak inceliyelim :

1)      GÜVENLİK

 

Yedekleme ve Arşivleme veri iş sürecinin son noktasını temsil etmekte olduğundan bu noktada hataya yapmaya yer yoktur. Dolayısıyla herhangi bir yedekleme/arşivleme platformu güvenli olmalıdır. Tekilleştirme platformları ise diğer tüm güvenli platformlarının unuttuğu risklere karşı önlem almalıdır. Bu sistemler veri parçalarını tek kopya olarak sakladıklarından, tek bir parçanın kaybı bu parçaya bağlı tüm veri kopyalarının erişilemez olduğu anlamına gelecektir. Bu yüzden öncelikle güvenlik, güvenlik ve yine güvenlik bir Tekilleştirme Sisteminin sizin ihtiyaçlarınıza ne oranda cevap verip veremeyeceğini belirler.  GÜVENLİK tam olmalıdir. Sisteminiz oluşabilecek hataları pro-aktif olarak öncelikle mümkün olduğunca oluşmadan engellemeli, veri parçalarını doğru yazıp yazmadığını her fırsatta kontrol etmeli, tüm önlemlere karşı hata oluştuğunda ve tespit edildiğinde otomatik olarak düzeltmelidir. Tüm bu önlemleri oluşabilecek  donanımsal ve özellikle yazılımsal (logical) hatalara karşı alabilmelidir. Yazılımsal hatalar en büyük tehlikeyi oluşturmaktadır ve donanım hatalarına karşılık tespitleri ve düzeltilmeleri çok daha zordur. Koruma mekanizmaları aynı zamanda sistemi oluşturan tüm parçaların (server, storage, arabirimler, yazılım) bütünü için tek merkezden gerçekleştirebilmelidir.  Tüm önlemlere karşılık alınan önlemlerin de yeterli olmadığı durumlarda olacaktır. İşte bu noktada da sisteminiz kendi yedeklerini operasyonel yük getirmeyecek şekilde kendi içersinde almalı ve mümkün olan en yakın son haline geri dönebilmelidir.  3-4 kalkanlı ve tüm komponentleri koruyan bir mekanizması olmayan bir tekilleştirme sistemi güvenli olamayacağı gibi veri korumada  veya arşivlemede de çözüm olamayacaktır.

Kalkan 1: Oluşabilecek Hataların Engellenmesi :

 

Tekilleştirmenin yedekleme ve arşiv amaçlı kullanımında, sisteme eklenen veri sürekli olarak yeni veri parçalarıdır. Dolayısıyla tekilleştirme uygulamalarında,  alışık olduğumuz diğer dosya sistemlerinde olduğu gibi mevcut blokları değiştirmek ihtiyacı yoktur. Bu özellikten yararlanılarak, tekilleştirme için yaratılmış bir dosya sisteminde geleneksel dosya sistemlerinde bulunan mevcut blokların değiştirilmesi için oluşturulmuş komplex yapılar  (eğer elinizdeki teknoloji bunu gerçekleştirebiliyorsa)ortadan kaldırılabilir. Eğer kullandığınız teknoloji tekilleştirme uyulamaları için özel geliştirilmiş bu tarz bir dosya sistemini içersinde barındırıyor ise, sisteme eklenmesi gereken yeni parçalar yeni dosyalar içersine yazıldıktan sonra değiştirilemeyecek şekilde kitlenip kapatılır. Yazılan eski parçalar dosya sisteminde değiştirilemeyecek formatta saklandıklarında, birçok olası yazılımsal hatanın oluşabilmesi baştan engellenmiş olur. Eğer bir hata da oluşuyorsa en son henğüz kapatılmamış dosya içersinde oluşacaktır. Bu hatalar henüz kapatılmamış en son oluşturulmakta olan dosya içersinde olacağından tespitleri çok daha kolay ve tamir edilmesi gereken kısım çok küçüktür.  Mevcut blokların değiştirilmeden saklanabilir olduğu bir dosya sistemi oluşması olası birçok hatayı daha oluşmadan engellemiş olur.

image001

 

Kalkan 2: Veri Parçalarının Korunması; RAID-6 ve Checksum

 

image002 

 

 

Sisteme kaydedilecek her veri parçasının sağlaması güçlü bir checksum algoritması ile yapılmalıdır. Checksum sağlama işlemi veri sisteme kaydedilmeden önce, parça her okunmak istendiğinde, replikasyon işleminden önce ve sonra tekrarlanmalıdır. Tespit edilen bir hata ise anında RAID mekanizması (önerilen kesinlike RAID-6’dır) ile düzeltmelidir. Saklanan veri parçaları yedek ve arşiv sistemlerinde aylar, hatta yıllar boyu hiç okunmadan veya erişilmesine ihtiyaç olmadan durabileceklerinden;  kontrol mekanizmasının sadece veri erişimlerinde çalıştırılması yeterli olmayabilir. Checksum sağlaması işlemi, bu tür parçalarda oluşabilecek hataları tespit edip düzeltmek için peryodik olarak sistemdeki tüm veri için gerçekleştirmelidir. (scrubbing)

 

Kalkan 3: Verinin Silinmeye, Değiştirilmeye Karşı Korunmas; Snapshot

 

image003 

RAID ve Checksum bir yere kadar koruma sağlıyabilir. Örneğin sistemdeki dosyaların (yedeklerin) yanlışlıkla silinmesine, veya metadatanın tamamen kaybına karşı çözüm olmayabilirler. Bu tür durumlarda sistemin tamamının snapshotlarla korunabilmesi elzemdir. Snapshot gerek metadata’nın hızlıca geri oluşturulmasını, gerekse sistemdeki yedeklerinin geriye dönük olarak kurtarılmasını sağlar. Alınan yedeklerin yanlışlıkla silinmesine karşılık koruma da sistemde günler/haftalar boyunca saklanabilecek snapshotlar sayesinde sağlanır. Bilnen veri depolama sistemlerinin aksine, sisteminiz tekilleştirme için özel bir snapshot mekanizmasına sahip ise, alınan snapshotlar sadece metadatanın bir kopyası olarak saklanıcak, ve yine tekilleştirmeye özelleştirilmiş dosya sisteminiz sayesinde sisteminizde değişen bloklar olmayacağından ek veri hacmine gerek olmayacaktır. Bu sayede rahatlıkla yüzlerce snapshot kopyasını sisteminizde bulundurabilirsiniz. Metadata’nın snapshotlardan da kurtarılamadığı çok ekstrem durumlarda, sistemin data’dan tekrar metadata’yı oluşturabiliyor olması da önemli bir özelliktir.

Kalkan 4:  Sistemin Bütününün Korunması

 

 

image004 

Sistemden kasıt bütün komponentlerdir. Tüm tekilleştirme çözümleri yazılım+sunucu+veri deposu  ve bunlari birbirlerine bağlıyan ara birimlerden oluşur. Tekilleştirme işlemini asıl gerçekleştiren  yazılım içersindeki algoritmadır. Bunu gerçekleştiren yazılım, sistemin altında  çalışan herhangi bir katmanda oluşabilecek hatalara karşı tepki verebilmeli, bunları düzeltebilmelidir. Tek bir kontrol mekanizması olmalıdır; her komponent çeşitli senaryolara birbirirnden bağımsız farklı tepkiler vermekteyse risk vardır. Örneğin veri depolama sistemi içersindeki RAID veya SnapShot mekanizmaları tekilleştirme yazılımı tarafından kontrol edilemiyorsa bunun anlamı tam bir karışıklık olabilir. Tekilleştirme yazılımınız belki düzgün çalışmaktadır, tek bir blokun hatalı olduğunu belki tespit etmektedir, ancak gerekli komutu donanıma iletememekte, veya veri depolama ünitesi yanlış zamanda bir koruma mekanizmasını devreye sokarak yazılım hatalarının oluşmasına sebep verebilmektedir. Her parçanın doğru saklandığı garanti altına alınırken, sistemi oluşturan tüm komponentler de tek merkezden güvenlik altına alınmalıdır. Sonuç olarak herhangi tek bir komponentin çalışmaması, tüm verinin erişilemez olduğu anlamına gelecektir. Sistemi oluşturan komponentler birbirlerini işaret edip ‘ben elimden geleni yaptım, o yapmadı’ demesi yerine tüm yazılımsal ve donanımsal koruma mekanizmaları sunucu, yazılım ve veri depolama ünitesi için tek merkezden kontrol edilmelidir.

Burada asıl tehlike bazı tekilleştirme yazılım üreticilerinin ‘Ben her ortamda tekilleştirme yaparım, donanımdan da bağımsızım’ demeleridir. Çok tehlikeli bir söylemdir ve kaçınılmalıdır. Aslolan yazılımın ne yaptığının ötesinde tüm komponentlerin tam güvenliğinin sağlanabilmesidir. Tekilleştirmede tam güvenlik ancak sistemi oluşturan tüm bileşenlerin yazılımsal ve donanımsal hatalara karşı tek merkezden korunmasıyla gerçekleşebilecektir.

 

2)      PERFORMANS

 

Veriye geri dönebileceğinizi aldığınız güvenlik önlemleriyle garanti altına aldıktan sonra önemli olan ne kadar hızlı geri dönebildiğinizdir. Veriyi ne kadar hızlı yedeklerseniz, yedek pencereleriniz o kadar dar olacak, sistemleriniz gerçek görevlerini yapmak için o kadar fazla vakit ve enerji bulacaklardır. Güvenlikten sonra önemli bulduğumuz ikinci kriterimiz performans:

 

CPU’ya bağımlı Tekilleştirme: Tekilleştirme Toplam Performansı Artırabilir!

 

Batıl inanç tekilleştirme işleminin veri yedekleme veya kurtarma performansını negatif yönde etkileyeceğidir. Ya da tekilleştirme yapan bir sistemin, yapmayana göre her zaman daha yavaş olacağı düşünülür.  Eğer elinizdeki sistem veri parçalarını birbiriyle disk performansına bağımlı olarak karşılaştırmakta ise, tekilleştirme işlemi yedekleme performansını kötü etkileyecektir. Ancak eğer elinizdeki sistem sadece CPU gücü ile tekilleştirme yaparken, alttaki disk sistemine bağımlı kalmadan tekilleştirme işlemini gerçekleştiriyorsa, tekilleştirme gerçekleştirmeyen bir sisteme göre katlarca fazla performans sağlıyabilr. Nasıl mı? Diyelim ki 10TB veri yedekleyeceğiz. Tekilleştirme yapmayan sistem bu 10TB’ı diske yazmak zorunda, yapan ise belki sadece 1TB yazmak durumunda, belki ondan da az.

image005

Bu sayede çok daha küçük bir disk altyapısı ile tekilleştirme sistemleri çok daha yüksek performans sağlıyabilirler. Burda önemli olan alınan performansın diske değil CPU’ya bağımlı olabilmesidir.  CPU’ya bağımlı tekilleştirme sistemleri tek bir sistem içersinde günümüzde saatte 12TB’ın üzerinde tekilleştirmeli yedekleme performansı sağlıyabilmektedir. Bu rakam 3-4 sene önce saatte yarım TB’ın da altındaydı.  CPU hızları her 16 ayda bir ikiye katlandı ve katlanarak artmaya devam ediyor. CPU bağımlı bir tekilleştirme teknolojilerinin bilinen tüm tabuları performans sınırlarında yıkmalarının arkasında bu teknolojik ilerleme yatıyor. Saatte 12TB rakamın yanına bırakın tekilleştirme yapmayan veri yedekleme sistemlerini, en hızlı veri depolama üniteleri bugün zor erişebilmektedir. Asıl olan eğer tekilleştirme algoritmanız yeterince akıllı ise ve benzer parçaları alttaki veri depolama ünitesine (diske) yüklenmeden sadece CPU’ya bağımlı gerçekleştirebiliyorsa tekilleştirme yapmayan sistemlere oranla çok daha hızlı olabileceğidir. ‘Benim çok performansa ihtiyacım yok, bana saatte yarım TB performans yetiyor’ diyorsanızi, cpu bağımlı tekilleştirme teknolojisi bunu tekilleştirmeden gerçekleştiren diğer teknolojilere oranla çok daha ufak bir altyapı ile daha az yakıt tüketerek gerçekleştiriyor olacaktır.

 

CPU hızlarının Disk hızlarına göre daha da katlanarak artıyor olacak olması gelecekte CPU’ya bağımlı performans sergileyen tekilleştirme sistemlerinin rakiplerine oranla çok daha hızlı olacağı anlamına gelmektedir. Sisteminizin sadece CPU’sunu güncelleyerek mevcut disk altyapınızla 2-3 kat performans alabilmek mümkün olacak, yakın gelecekte performans artışı yaparken yatırımızın önemli bir kısmını koruyabiliyor olacaksınızdır.

 

 

Inline vs Post Proses:

image006

Tekilleştirme işleminin inline olması (Benzer Veri parçalarının henüz diske hiç yazılmadan cpu ve memory içersinde yok edilmesi), tüm yedeğin diske yazılmasından sonra tekilleştirilmesine kıyasla büyük avantaj getirecektir. Post Proses sistemler yedekleme, yedeklenen datanın tekilleştirme için okunması, tekilleştirme işlemi sırasında tekrar yazma ve işlem bitiminde alınan tekilleştirmemiş yedek kopyasının sonradan silinmesi gibi 4 ayrı aşamadan geçmek zorundadırlar. Inline sistemler ise tek aşamada tüm işlemi bitirirler. Post Proses sistemler inline’a göre çok daha yüksek kapasitelere ihtiyaç duyacaklardır. Gerek cpu, gerekse disk kapasitesine. Full yedeklerin en az bir kopya saklanabilmesi için ek kapasite ihtiyacının yanısıra, herhangi bir tekilleşmiş kopyaya geri dönüş için sistemde bu yedeğin sıkıştırılmamış kopyası kadar yer bulunması zorunluluğu vardır. Sistemin I/O bant genişliği ve cpu gücü inline bir sistemle aynı performansı verebilmek için çok daha yüksek olmalıdır, çünkü bir kere yazmak yerine 4 kere işlem yaparak yazmak ve okumak zorundadır. Asıl problem ise sistemde oluşabilecek belirsiz performans parametreleridir. Örneğin sistem boşta iken yüksek geri dönme hızı sağlarken, tekilleştirme döngüsü esnasında geri dönme performansı farklı olacaktır. Replikasyonun tekilleşmiş kopyadan yapılacağı, kopya işleminin daha geç yapılacağı ve replikasyon penceresinin daha dar olduğu anlamına gelmektedir. Herşeyin ötesinde asıl büyük problem bir tekilleştirme döngüsünün başarısız olmasıyla başlar. Örneğin post proses sisteminiz günde 8 saat yedek almakta ve 16 saatte bu alınan yedekler tekilleşmektedir. Diyelim ki herhangi bir gün tekilleşme işlemi bir sebepten ötürü gerçekleşemedi. İkinci yedeği de öbür gece aldınız. Sistem 32 saat sonra ancak tüm tekilleştirmeyi bitirebilecek bu sırada tekilleştirme 3. Yedek döngüsüyle çakışacak, yedek döngünüz uzayacak veya sistemde yeterli boş kapasite kalmayacaktır.  Bu tür problemlerle karşılaşmamak için post-proses sistemler %50-60 kapasite doluluğu üzerinde çalıştırılmamalı, sistemde daima fazlasıyla boş yer bırakılmalı ve sistemin tekilleştirme döngüsü en az yedek döngüsü kadar kısa olmalı, buna göre sistem ek cpu gücüyle donatılmaı, yedekleme ile tekilleştirme zamanları birbirinden tamamen ayrı tutulabilmelidir. İnline sistemlerde ise denklem basittir. Tek bir işlem olduğundan sistemin yedekleme performansı her zaman aynıdır. Bu tür sistemler rahatlıkla %80-90 doluluk oranlarında güvenle çalıştırılabilir, replikasyon işlemi yedekle paralel yapılabildiği gibi 24 saate yayılarak gerekli bant genişliği daraltılabilir. Alınan yedeklerin sıkıştırılmamış kopyaları sisteme hiç yazılmadığından da sistem de fazla kapasiteye ihtiyaç yoktur.

Tek Stream Okuma ve Yazma Performans Kriteri :

image005 

 

Tüm üreticiler sistemlerinin toplam eriştikleri hızı broşürlerine yazmaktadırlar. Bu önemli bir kriterdir elbet. Sisteminizden toplamda ne kadar performans alabileceğiniz ortamınızdaki toplam yedekleme performansında belirleyici olacaktır. Ancak tekilleştirme sistemlerine özel ve çok önemli olan bir kriter var. Tek bir Stream okuma ve yazma performansı (single stream read/write). Bu değerler özellikle büyük veri tabanlarını tekilleştirerek yedeklerken çok önemlidir. Tekilleştirme sistemlerinde multiplexing yapmak olası değildir. Tek bir okuma ve tek bir yazma şeklinde yedekleme yapılır. Örneğin RMAN ile tekilleştirme sistemine fileperset=1 ile yazmak zorundasınızdır. Tek stream yazma performansı yeterince iyi olmayan bir tekilleştirme sistemi özellikle büyük veri tabanlarının yedeklenmesi sırasında performans olarak bekleneni veremeyecektir. Geleneksel teyp sistemlerinin single stream write hızları da düşüktür, bu açıklarını birçok streami aynı anda yazarak (multiplexing) kapatırlar (bakınız soldaki resim). Tekilleştirme sistemlerinde multiplexing veri parçalarını her seferinde farklı kombinasyonlarla birleştirerek tekilleştirme oranını önemli ölçüde azalttığından kullanılmamalıdır. İşte bu yüzden elinizdeki tekilleştirme sisteminin single stream write hızı, tüm aplikasyonlarınızın ve özellikle bu farkı çok daha fazla algılayabileceğiniz büyük veri tabanları ortamında belirleyici olacaktır.  Ve aynı şekilde single read hızı da geri dönme işlemlerinin sisteminizde ne ölçüde hızlı olacağını belirleyecektir.

3)      BİRDEN FAZLA PROTOKOL DESTEĞİ ve Kullanım (ARŞİV ve YEDEKLEME Tek Platformda) :

 

image006 

 

Teyp kullanıcıları disk sistemlerine geçiş yaparken VTL teknolojilerine çok kolay adapte oldular. VTL (Virtual Tape Library)’ler disk sistemlerini teypmiş gibi göstererek alışılmış yedekleme prosedürlerimizi ve alışkanlıklarımızı değiştirmeden disk sistemlerinin avantajlarından yararlanmamızı yıllarca sağladılar ve bunu çok iyi bir şekilde yapmaya devam ediyorlar. Aslolan gerçek ise VTL teknolojisinin bir ara-geçiş teknolojisi olduğu. Disk sistemlerini  disk gibi değil de teyp gibi kullanmamızın tek bir sebebi var : Henüz disk sistemlerini disk gibi kullanmaya gerek altyapı, gerek yedekleme yazılımları gerekse de keni alışkanlıklarımızdan vazgeçememek sebebiyle hazır değiliz. Eğer yedekleme yazılımınız diski disk gibi kullanmaya hazır, network altyapınız yüksek hızları desteklemekte ve siz de bu değişime hazırsanız disk sistemlerini disk gibi kullanmanın çok büyük avantajları olabilmekte. Elinizdeki tekilleştirme sisteminin VTL yanı sıra NFS, CIFS, OST gibi protokolleri desteklemesi FC yanı sıra IP üzerinden bağlantı yapabilmesi bugünkü ihtiyaçlarınızın ötesinde ilerde yapmak isteyeceğiniz değişiklikler konusunda size esneklik sağlıyacaktır. Hem VTL hem D2D yapabileceğiniz bir platform olmasının yanı sıra, CIFS ve NFS protokolleri sayesinde sisteminizi sadece bir yedekleme platformu olarak değil aynı zamanda bir arşiv platformu olarak da kullanabilirsiniz. Arşivlenen veri ile yedeklenen veri aynı olduğu için bu işlemlerin tek platformda gerçekleştirilebilmesi tekilleştirme avantajlarını katlıyarak artırıyor olacak, arşiv ve yedek replikasyonu için de toplamda çok daha az bant genişliği ihtiyacı olacak demektir. Sisteminiz farklı yedekleme aplikasyonlarıyla çalışabilmekte olmasının yanı sıra standart protokoller aracılığı ile çok sayıda arşiv yazılımı ile birlikte çalışabiliyorsa büyük esneklik sahibi olmanın yanı sıra, geleceğe yönelik yatırımınızı da koruyor olacaksınız demektir.

4)      Replikasyon :

 

image007 

Tekilleştirmenin sağladığı en büyük yararlardan bir tanesi alınan yedeklerin veya arşivlenen verinin replikasyonunun çok daha düşük bir bant genişliği üzerinden gerçekleştirilebiliyor olmasıdır. Replikasyonun yapılabilmesinin ötesinde kuşkusuz nasıl yapıldığının önemi büyüktür. En önemli konu tekilleştirmeli veri depolama sistemlerinde replikasyon sırasında verinin sıkıştırılmış ve tekilleşmiş olarak karşı tarafa gönderilmesidir. Tabii güvenliği unutmadan. Veri parçaları karşı tarafa göderilmeden önce ve sonra checksum konrolleri muhakkak yapılmalıdır. Alınan snapshotlar da karşı tarafa replike edilebilmelidir. İkinci derecede önemli kriter replikasyon işleminin tekilleştirmeli yedekleme işlemi ile toplam yedekleme performansını etkilemeden eşzamanlı yapılabilmesidir. Eşzamanlı (inline)yapılan replikasyon RTO değerinin felaket kurtarma için en aza indirilmesinin ötesinde replikasyon penceresinin 24 saate yayılarak ihtiyaç duyulacak bant genişliğinin en aza indirilmesi avantajını getirir. Replikasyon sırasında kullanılacak bant genişliğinin sistem tarafından ayarlanabilmesi, bu bant genişliğinin farklı saatlerde çeşitli genişliklerde ayarlanarak kullanılabilmesi, oluşabilecek hat kesintilerine karşılık replikasyon işleminin toleranslı olması, en gürültülü hatlarda dahi sistemin replikasyon işlemini sürdürebilmesi çok önemli kriterlerdir. Desteklenen Replikasyon topolojilerinin çeşitliliği (çok noktadan tek noktaya, tek noktadan çok noktaya, cascaded, çift yönlü ve kombinasyonları gibi) önemli esneklik sağlıyor olacaktır. Çok protokol destekleyen sistemlerde (VTL, D2D, CIFS, NFS, OST gibi) replikasyon tek ara birimden yürütülebilmeli ve protokol bağımsız olmalıdır. OST gibi protokollerde replikasyon işleminin yedekleme yazılımı içersinden yürütülebilir olması ve tekilleştirme sisteminin uzakta oluşturduğu kopyanın yedek kataloğuna yazılıyor olması diğer protokollere göre önemli bir farklılık yaratmaktadır.
Farklı Tekilleştirme yöntemlerini bir sonraki yazımda irdeliyor ve kıyaslıyor olacağım.

 

sizlere tuzlabilgisayarci.net farkıyla sunulmuştur. Tuzla BilgisayarGökyüzü Bilgisayar

Hakkında ates_kqual202

Cevapla

Scroll To Top