Apache Iceberg, Parquet, Polaris 및 Arrow 개발자 리스트 다이제스트: 2026년 1월 6일–14일
I’m happy to translate the article for you, but I’ll need the text you’d like translated. Could you please paste the content (or a portion of it) you want converted into Korean? I’ll keep the source line and all formatting exactly as you requested.
📚 데이터 레이크하우스 도서 모음
- Apache Iceberg: 정통 가이드
- Apache Polaris: 정통 가이드
- Apache Iceberg Lakehouse 설계
- Apache Iceberg 다이제스트: Vol. 1
🌐 Lakehouse Community
Source:
📅 Weekly Community Update (Second week of January 2026)
2026년 1월 둘째 주에는 Apache Iceberg, Polaris, Arrow, Parquet 커뮤니티가 휴가 모드에서 활발한 개발 단계로 전환하면서 지속적인 모멘텀을 보였습니다. 주요 내용으로는 거버넌스 논의, 커뮤니티 조직, 그리고 2026년 전체 라이크하우스 생태계를 형성할 기술 제안들이 포함됩니다.
Apache Iceberg
-
Iceberg‑Spark Community Sync Established
Anurag Mantripragada가 메인 커뮤니티 싱크와 별도로 Spark‑Iceberg 통합을 위한 월간 싱크를 제안했습니다. 이 아이디어는 Anton Okolnychyi와 Kevin Liu의 즉각적인 지지를 받았으며, 첫 Iceberg‑Spark Community Sync는 **1월 20일 (오전 10‑11시 PT)**에 예정되었습니다.- Agenda: 정렬 순서 보고, Spark 4.1 지원, DataFusion‑Comet 통합의 향후 방향.
- Details: mail archive link
-
Project Blog Launch Vote Passes
Kevin Liu가iceberg.apache.org/blogs/에 공식 Apache Iceberg 블로그를 설립하기 위한 정식 투표를 소집했습니다. 투표는 Russell Spitzer, Steven Wu 등 다수의 구속·비구속 +1을 얻으며 통과되었습니다.- 첫 게시물은 Iceberg Summit 2026을 홍보할 예정입니다.
- Details: mail archive link
-
OAuth2 Manager v2 Proposal Discussion
OAuth2 Manager v2 설계 문서가 현재 다듬어지고 있습니다. Christian Thiel은 1.5년 동안 사용되지 않은 레거시 토큰 교환 동작을 마이그레이션할 필요가 있는지 질문했습니다.- Decision meeting: 1월 14일 catalog sync.
- Details: mail archive link
-
Summit CFP Reminder
1월 18일 마감인 Call‑for‑Papers 제출 기한이 다가오고 있습니다.- Robin Moffatt이 선정 위원회 구성에 대해 문의했습니다.
- Jean‑Baptiste Onofré는 Russell Spitzer를 주요 PMC 연락 담당자로 확인하고, 위원회 소속은 최종 제안서에 명시될 것이라고 밝혔습니다.
Apache Polaris
-
Graduation Momentum
1월 초에 정기 커뮤니티 싱크와 개발 스프린트가 지속되었습니다. 확대되는 PPMC는 거버넌스 성숙도가 건강함을 보여줍니다.- Generic Table 기능(외부 포맷인 Apache Hudi와 Delta Lake를 카탈로그하는 기능)이 다음 릴리스에서 베타를 졸업할 예정입니다.
-
Integration‑Testing Expansion
AWS 크레딧이 확보됨에 따라, 기여자들은 실제 클라우드 인프라를 대상으로 한 통합 테스트 확대를 논의했습니다—특히 IAM AssumeRole 흐름과 로컬에서 시뮬레이션하기 어려운 자격 증명 제공 시나리오에 중점을 두었습니다. 이번 투자는 프로덕션 준비 검증을 크게 향상시킬 것입니다.
Apache Arrow
-
Leadership Continuity Confirmed
Arrow 공동 창시자인 Antoine Pitrou가 공식적으로 PMC Chair에 임명되어 거버넌스 안정성을 강화하고, 프로젝트 창립 리더십의 지속적인 기술 비전을 제공하게 되었습니다. -
Format Enhancements Continue
진행 중인 작업:- 시간대 지원이 포함된 시간 유형.
- 향상된 계산 함수.
이러한 점진적 업데이트는 Arrow가 엔진 및 언어 전반에 걸친 분석 워크로드를 위한 범용 컬럼형 교환 레이어로서의 위치를 유지하도록 합니다.
Apache Parquet
-
Board Report Draft Circulated
Julien Le Dem이 1월 14일 제출 마감과 1월 21일 이사회 회의를 앞두고 커뮤니티 검토를 위해 초안 보드 보고서를 공유했습니다.- Fokko Driesprong이 보고서를 검토·승인했으며, 보고서는 최근 릴리스 활동과 커뮤니티 건강 지표를 다룰 예정입니다.
-
1.17.0 Release Finalized
1월 2일 투표 통과 후, 기여자들은 서명을 검증하고 최종 릴리스 검증을 수행했습니다.- 이번 릴리스는 최소 런타임을 Java 11로 올리고 Java 8 지원을 중단하는 중요한 현대화 마일스톤을 포함합니다.
-
FSST Encoding Progress
FSST(Fin
ite State Symbol Table) 압축은 문자열 및 바이트‑배열 인코딩에 고급 기능을 제공합니다. 기여자들은 문자열‑중심 워크로드에 대한 파일 크기를 줄이기 위해 여러 컬럼 페이지에 걸쳐 압축된 사전을 효율적으로 공유하는 방안을 탐구하고 있습니다.
🔄 교차 프로젝트 테마
Java 현대화 물결
Iceberg와 Parquet 모두 Java 요구 사항을 높이고 있습니다 (Parquet는 Java 11로, Iceberg는 유사한 움직임을 고려 중). 이 추세는 현대 런타임, 향상된 성능, 그리고 변화하는 Java 생태계와의 더 나은 정렬을 위한 광범위한 추진을 반영합니다.
Data Lakehouse 커뮤니티가 준비했습니다.
Modernization and Ecosystem Maturity
- Language & Build Updates – 프로젝트가 Java 17로 이동하면서 최신 언어 기능과 더 깔끔한 의존성 관리가 가능해졌습니다. 이러한 조정된 현대화는 생태계의 성숙도와 레거시 런타임 지원을 포기하려는 의지를 반영합니다.
- Community Infrastructure Investment – Iceberg의 특화된 Spark 동기화 및 프로젝트 블로그부터 Polaris의 확장된 테스트 인프라까지, 모든 프로젝트가 기술 논의를 실제 구현 지침과 향상된 참여로 전환하는 커뮤니티 메커니즘에 투자하고 있습니다.
- Format Evolution Balancing Act – Iceberg가 V4 기능을 탐색하고 Parquet이 V3 가능성을 검토하는 동안, 두 프로젝트 모두 혁신과 안정성 사이의 신중한 균형을 유지하여, 파괴적인 변화를 도입하기 전에 프로덕션 사용자가 완전한 기능과 안정성을 갖춘 플랫폼을 사용할 수 있도록 보장합니다.
앞으로의 계획
- Iceberg Summit CFP가 1월 18일에 마감됩니다.
- Parquet Board Report 제출 마감일은 1월 14일입니다.
- 첫 번째 Iceberg‑Spark 커뮤니티 동기화가 1월 20일에 진행됩니다.
- Atlanta Iceberg meetup이 1월 21일에 열리며, 2025년 내내 성장해 온 풀뿌리 커뮤니티 구축 노력을 지속합니다.
Lakehouse 생태계가 성숙해짐에 따라, 이러한 거버넌스, 커뮤니티 및 기술 기반은 Apache Iceberg, Polaris, Arrow, 그리고 Parquet가 또 한 해 동안 프로덕션 수준의 혁신과 생태계 성장을 이룰 수 있도록 자리매김합니다.