Image

사람들이 흔히 이야기하는 클라우드는 클라우드 스토리지인 경우가 많다. 서비스 업체의 서버에 자신의 사진, 문서 등의 데이터를 저장하는 서비스이다. 보통 컴퓨터를 많이 만지는 사람들이 클라우드라고 하면 클라우드 컴퓨팅을 이야기 하는 경우가 많다. 서비스 업체의 서버에 자신의 가상 서버를 임대해서 사용하는 서비스이다.

하지만 백블레이즈는 그 둘 과 조금 다른 결의 클라우드이다. We make storing and using data astonishingly easy. 라는 문구를 사이트에 잔뜩 달아놓은 이 클라우드 기업은 백업을 전문으로 한다. 구글 드라이브나 원드라이브에 파일을 올리는 것도 하나의 백업이 될 수 있다. 하지만 보통 그런 파일들은 자주 사용하는 데이터를 쓰는 것이 좀 더 편하며, 백블레이즈가 제공하는 서비스들은 보통 갑작스럽게 데이터를 날리게 되었을 때 사용하게 되는 경우가 많다. 카카오 뱅크의 입출금 계좌와 세이프박스 정도의 차이로 이해하면 쉽다.

백블레이즈는 B2와 Personal Backup 이렇게 2 가지 서비스를 제공하고 있다.

B2

B2 는 오브젝트 스토리지로 달에 1GB 당 0.005 USD // 다운로드는 1GB 당 0.01 USD로 홈페이지에서는 S3 스탠다드와 비교하여 80 퍼센트 이상 저렴하다고 홍보하고 있다. 다운로드 비용은 심지어 클라우드 플레어 API를 사용하여 워커를 통해 클라우드 CDN 으로 다운로드 하면 무료이다. 다른 클라우드 드라이브와 비교했을 때는 무제한으로 데이터를 저장할 수 있는 장점이 있고, 다른 오브젝트 스토리지 ( S3 standard ) 와 비교했을 때는 저렴한 용량당 가격을, 다른 장기 백업 스토리지와 ( S3 Glacier ) 비교했을 때는 최소 데이터 보관 기간이 없다는 장점이 있다. 그래서 마스토돈 등을 운영할 때 오브젝트 스토리지로 많이 사용하거나, 소산백업 겸 서버 중장기 보관 백업 용도로 많이 사용한다. 나 같은 경우는 이 블로그를 백업하는 용도로 사용했는데 DB 덤프, 웹디렉토리, 아파치 설정을 백업 디렉터리에 모두 모아서 API 키를 rclone 에 등록하여 SYNC 하는 형식으로 백업한다.

Personal Backup

Personal Backup 은 개인 컴퓨터를 백업하는 서비스로 한 대 당 월 7 달러에 백업 서비스를 제공한다. 다만 우리가 흔히 생각하는 백업 스토리지는 아니다. 자신의 디스크 용량만큼 백업하며, 30일 동안 오래된 파일 유지한다. 즉 30일에 한번은 Personal Backup 에 온라인 되어 있어야 한다. 다만 월 2 달러를 추가로 결제시 1년 동안 유지 시켜준다. 해당 서비스는 다운로드 비용은 무료이고 8TB 의 USB 디스크로 백업을 수령할 경우 189 달러를 지불해야한다. 프로그램을 다운 받아 실행하면 자동으로 백업이 이루어지며 윈도우즈와 맥에서 지원한다. 해당 서비스는 워크스테이션에서 사용하고 있는데 아무래도 날라가면 꺼려지는 파일들이 많고, B2 와 비교해서 프로그램을 실행해서 로그인만 해두면 되니 간편하며, 저장하려는 데이터가 1 400 GB 를 넘어가게 되면 Personal Backup 이 훨씬 싸기 때문이다. 아무래도 워크스테이션에 저장 되는 데이터들은 서버 오브젝트 스토리지에서 쓰는 데이터보다 용량이 크기 때문에 Personal Backup 을 사용하고 있다.

Backblaze Drive Stats

Image

사람들이 백블레이즈를 알게 되는 많은 이유 중 하나는 바로 백블레이즈에서 사용하는 디스크의 연간 고장 보고서 때문일 것이다. 백블레이즈는 이처럼 고객들의 많은 데이터를 저장하기 때문에 많은 양의 디스크를 사용할 수 밖에 없고, 이것을 정리해서 매년 보고서로 내놓는다. 역시 올해도 1월에 2022년 디스크 들에 대한 보고서를 냈다. ( https://www.backblaze.com/blog/backblaze-drive-stats-for-2022/ )

2022년 12월 31일 까지 235 608 개의 디스크를 관리하고 있으며 그 중 데이터 디스크는 231 309 개의 어마어마한 규모로 운영하고 있다. 해당 보고서를 표와 차트로 정리하면 다음과 같다.

Image

Image

보통 해당 보고서는 하드디스크 제조업체를 고르는데 신뢰성 있는 기준으로 삼는다. 2022년 보고서에 따르면 SEAGATE 하드디스크의 연간 고장률이 (AFR, annualized failure rate) 높은 편이었으나 씨게이트 하드가 전반적으로 다른 제조업체 디스크보다 오래 되었으며 그럼에도 불구하고 백블레이즈 환경에서 씨게이트 하드디스크를 지속적으로 구매하는 것은 이미 오류가 날 것은 상정한 시스템이고, 유의미하게 효율을 떨어뜨리지 않기 때문에 비교적 가격이 저렴한 씨게이트 하드디스크를 구매한다고 한다.

또한 백블레이즈는 SSD 사용 이후 SSD 에 대해서도 관련 보고서를 내고 있다. ( https://www.backblaze.com/blog/ssd-edition-2022-drive-stats-review/ ) 백블레이즈에서는 SSD 를 부팅 디스크로 사용하여 총 2 906 개를 운영하고 있다. 아직은 HDD에 비해 그렇게 많은 데이터와 통계가 쌓여있지는 않지만 지속적으로 SSD와 HDD 를 비교하는 글들을 내놓고 있다.

SSD 는 정말 믿을만 한가에 대해서도 글을 썼는데 ( https://www.backblaze.com/blog/how-reliable-are-ssds/ ) 해당 글에 따르면 3년까지는 SSD와 HDD 는 비슷한 고장률을 보이다가 4년 후부터 HDD 가 더 높은 고장률을 보인다고 한다. 장기저장에 적합한지에 대한 질문에는 SSD 든 HDD 든 몇 년간 벽장에 박혀 있는 것은 좋은 선택이 아니며, 백업 계획의 일부로 외장 드라이브를 사용하는 것은 좋지만 유일한 백업으로 만들지 말라는 원론적이고 정확한 말을 하였다. 다만 전반적으로 SSD 는 HDD 에 비해 비교적 실패할 확률이 적지만 실패했을 경우, 복구하기는 더 어렵다는 기조의 글을 남긴 적이 있다.

Storage Pod

Image

백블레이즈는 또한 자사에서 사용하는 서버를 오픈소스로 공개하고 있다. ( https://www.backblaze.com/b2/storage-pod.html )

빅테크 서버 기업들로 (Dell, HP, Supermicro 등) 에 대해 대항 하기 위해 처음 만들었으며 2019년에 10주년을 맞았다. 지금은 여러 부품 공급 등의 이유로 일부 상용 서버를 사용하기는 하지만, 해당 프로젝트가 여러 사람들에게 자체 스토리지 서버를 구축하고 해당 시장을 활성화한 것을 자축하며, 여전히 Storage Pod 프로젝트는 죽지 않았고 어쩌면 더 새로운 무언가로 나올 수 있다고 이야기 하였다.

해당 서버는 새시에 대한 2D, 3D 도면과 파트 리스트, 배선 가이드 등을 제공하고 있다 ( https://www.backblaze.com/blog/open-source-data-storage-server/ )

오픈 소스 서버라니! 새시 도면에 파트리스트 있다니 실로 놀라울 수가 없다 해당 제품은 직접 만드는 것 말고도 서드 파티사에서 제조해서 팔고 있다고 한다. 그래서 찾아보니 45drives ( https://www.45drives.com/ ) 라는 업체에서 해당 도면을 커스텀해서 팔고 있었다. 가격은 AV15 서버 기준 제일 저렴한 것이 5 246.75 USD 로 백블레이즈에서 서드파티사를 통한 구입이 12 849.40 USD, 직접 만드는 것이 10 398.57 USD 에 비하면 제법 싼 가격에 팔고 있었다. 아마 백블레이즈는 풀사이즈 기준으로 적어 놓은 것 같은데 풀사이즈 기준 제일 저렴한 서버가 13 622.92 USD 로 크게 차이가 나지 않는 가격이다. 데이터 홀더가 재밌어 보여 해보고 있는 입장에서 한번쯤은 로망으로 사고 싶지만 지금 환경에서 4U 짜리나 되는 랙을 안정적으로 운영하기는 무리가 있어 일단 보류하고 있다. 언젠가 가지고 있는 데이터가 엄청 많고 여유가 되면 시도해볼지도 모르겠다.