Apache Iceberg, Parquet, Polaris 및 Arrow 개발자 리스트 다이제스트: 2026년 1월 6일–14일

발행: (2026년 1월 15일 오후 10:35 GMT+9)
9 min read
원문: Dev.to

I’m happy to translate the article for you, but I’ll need the text you’d like translated. Could you please paste the content (or a portion of it) you want converted into Korean? I’ll keep the source line and all formatting exactly as you requested.

📚 데이터 레이크하우스 도서 모음

🌐 Lakehouse Community

Source:

📅 Weekly Community Update (Second week of January 2026)

2026년 1월 둘째 주에는 Apache Iceberg, Polaris, Arrow, Parquet 커뮤니티가 휴가 모드에서 활발한 개발 단계로 전환하면서 지속적인 모멘텀을 보였습니다. 주요 내용으로는 거버넌스 논의, 커뮤니티 조직, 그리고 2026년 전체 라이크하우스 생태계를 형성할 기술 제안들이 포함됩니다.

Apache Iceberg

  • Iceberg‑Spark Community Sync Established
    Anurag Mantripragada가 메인 커뮤니티 싱크와 별도로 Spark‑Iceberg 통합을 위한 월간 싱크를 제안했습니다. 이 아이디어는 Anton Okolnychyi와 Kevin Liu의 즉각적인 지지를 받았으며, 첫 Iceberg‑Spark Community Sync는 **1월 20일 (오전 10‑11시 PT)**에 예정되었습니다.

    • Agenda: 정렬 순서 보고, Spark 4.1 지원, DataFusion‑Comet 통합의 향후 방향.
    • Details: mail archive link
  • Project Blog Launch Vote Passes
    Kevin Liu가 iceberg.apache.org/blogs/에 공식 Apache Iceberg 블로그를 설립하기 위한 정식 투표를 소집했습니다. 투표는 Russell Spitzer, Steven Wu 등 다수의 구속·비구속 +1을 얻으며 통과되었습니다.

    • 첫 게시물은 Iceberg Summit 2026을 홍보할 예정입니다.
    • Details: mail archive link
  • OAuth2 Manager v2 Proposal Discussion
    OAuth2 Manager v2 설계 문서가 현재 다듬어지고 있습니다. Christian Thiel은 1.5년 동안 사용되지 않은 레거시 토큰 교환 동작을 마이그레이션할 필요가 있는지 질문했습니다.

  • Summit CFP Reminder
    1월 18일 마감인 Call‑for‑Papers 제출 기한이 다가오고 있습니다.

    • Robin Moffatt이 선정 위원회 구성에 대해 문의했습니다.
    • Jean‑Baptiste Onofré는 Russell Spitzer를 주요 PMC 연락 담당자로 확인하고, 위원회 소속은 최종 제안서에 명시될 것이라고 밝혔습니다.

Apache Polaris

  • Graduation Momentum
    1월 초에 정기 커뮤니티 싱크와 개발 스프린트가 지속되었습니다. 확대되는 PPMC는 거버넌스 성숙도가 건강함을 보여줍니다.

    • Generic Table 기능(외부 포맷인 Apache Hudi와 Delta Lake를 카탈로그하는 기능)이 다음 릴리스에서 베타를 졸업할 예정입니다.
  • Integration‑Testing Expansion
    AWS 크레딧이 확보됨에 따라, 기여자들은 실제 클라우드 인프라를 대상으로 한 통합 테스트 확대를 논의했습니다—특히 IAM AssumeRole 흐름과 로컬에서 시뮬레이션하기 어려운 자격 증명 제공 시나리오에 중점을 두었습니다. 이번 투자는 프로덕션 준비 검증을 크게 향상시킬 것입니다.

Apache Arrow

  • Leadership Continuity Confirmed
    Arrow 공동 창시자인 Antoine Pitrou가 공식적으로 PMC Chair에 임명되어 거버넌스 안정성을 강화하고, 프로젝트 창립 리더십의 지속적인 기술 비전을 제공하게 되었습니다.

  • Format Enhancements Continue
    진행 중인 작업:

    • 시간대 지원이 포함된 시간 유형.
    • 향상된 계산 함수.

이러한 점진적 업데이트는 Arrow가 엔진 및 언어 전반에 걸친 분석 워크로드를 위한 범용 컬럼형 교환 레이어로서의 위치를 유지하도록 합니다.

Apache Parquet

  • Board Report Draft Circulated
    Julien Le Dem이 1월 14일 제출 마감과 1월 21일 이사회 회의를 앞두고 커뮤니티 검토를 위해 초안 보드 보고서를 공유했습니다.

    • Fokko Driesprong이 보고서를 검토·승인했으며, 보고서는 최근 릴리스 활동과 커뮤니티 건강 지표를 다룰 예정입니다.
  • 1.17.0 Release Finalized
    1월 2일 투표 통과 후, 기여자들은 서명을 검증하고 최종 릴리스 검증을 수행했습니다.

    • 이번 릴리스는 최소 런타임을 Java 11로 올리고 Java 8 지원을 중단하는 중요한 현대화 마일스톤을 포함합니다.
  • FSST Encoding Progress
    FSST(Fin

ite State Symbol Table) 압축은 문자열 및 바이트‑배열 인코딩에 고급 기능을 제공합니다. 기여자들은 문자열‑중심 워크로드에 대한 파일 크기를 줄이기 위해 여러 컬럼 페이지에 걸쳐 압축된 사전을 효율적으로 공유하는 방안을 탐구하고 있습니다.

🔄 교차 프로젝트 테마

Java 현대화 물결

Iceberg와 Parquet 모두 Java 요구 사항을 높이고 있습니다 (Parquet는 Java 11로, Iceberg는 유사한 움직임을 고려 중). 이 추세는 현대 런타임, 향상된 성능, 그리고 변화하는 Java 생태계와의 더 나은 정렬을 위한 광범위한 추진을 반영합니다.

Data Lakehouse 커뮤니티가 준비했습니다.

Modernization and Ecosystem Maturity

  • Language & Build Updates – 프로젝트가 Java 17로 이동하면서 최신 언어 기능과 더 깔끔한 의존성 관리가 가능해졌습니다. 이러한 조정된 현대화는 생태계의 성숙도와 레거시 런타임 지원을 포기하려는 의지를 반영합니다.
  • Community Infrastructure Investment – Iceberg의 특화된 Spark 동기화 및 프로젝트 블로그부터 Polaris의 확장된 테스트 인프라까지, 모든 프로젝트가 기술 논의를 실제 구현 지침과 향상된 참여로 전환하는 커뮤니티 메커니즘에 투자하고 있습니다.
  • Format Evolution Balancing Act – Iceberg가 V4 기능을 탐색하고 Parquet이 V3 가능성을 검토하는 동안, 두 프로젝트 모두 혁신과 안정성 사이의 신중한 균형을 유지하여, 파괴적인 변화를 도입하기 전에 프로덕션 사용자가 완전한 기능과 안정성을 갖춘 플랫폼을 사용할 수 있도록 보장합니다.

앞으로의 계획

  • Iceberg Summit CFP1월 18일에 마감됩니다.
  • Parquet Board Report 제출 마감일은 1월 14일입니다.
  • 첫 번째 Iceberg‑Spark 커뮤니티 동기화1월 20일에 진행됩니다.
  • Atlanta Iceberg meetup1월 21일에 열리며, 2025년 내내 성장해 온 풀뿌리 커뮤니티 구축 노력을 지속합니다.

Lakehouse 생태계가 성숙해짐에 따라, 이러한 거버넌스, 커뮤니티 및 기술 기반은 Apache Iceberg, Polaris, Arrow, 그리고 Parquet가 또 한 해 동안 프로덕션 수준의 혁신과 생태계 성장을 이룰 수 있도록 자리매김합니다.

Back to Blog

관련 글

더 보기 »

기술은 구원자가 아니라 촉진자다

왜 사고의 명확성이 사용하는 도구보다 더 중요한가? Technology는 종종 마법 스위치처럼 취급된다—켜기만 하면 모든 것이 개선된다. 새로운 software, ...

에이전틱 코딩에 입문하기

Copilot Agent와의 경험 나는 주로 GitHub Copilot을 사용해 인라인 편집과 PR 리뷰를 수행했으며, 대부분의 사고는 내 머리로 했습니다. 최근 나는 t...