다음 DevOps 인터뷰가 더 쉬워졌습니다
개요: DevOps 인터뷰는 교과서적인 정의보다 실제 문제 해결에 초점을 맞추는 경우가 많습니다. 지원자들이 준비할 수 있도록 GitHub repository — devops…
개요: DevOps 인터뷰는 교과서적인 정의보다 실제 문제 해결에 초점을 맞추는 경우가 많습니다. 지원자들이 준비할 수 있도록 GitHub repository — devops…
매년 Red Hat Summit 기간에, 우리는 조직에 변화를 가져오고 열정과 헌신을 보여주는 Red Hat Certified Professionals를 인정합니다.
AI 컴퓨트와 스토리지가 추상화되고 멀티테넌트화되며 자동화됨에 따라, AI 인프라스트럭처는 이제 가속화된 네트워킹을 요구한다...
반응형 지원 모델은 단일 잘못된 구성으로 인해 전 세계 롤아웃이나 필수 프로덕션 업그레이드가 중단될 수 있을 때 위험 요소가 될 수 있습니다. 이를 해결하기 위해 Red Ha...
!Duncanhttps://media2.dev.to/dynamic/image/width=50,height=50,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fupload...
Transactions on Solana — What Sending and Breaking Them Taught Me의 커버 이미지 https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,gravity=au...
통합 tango‑integration‑interapis Tolola.tech Tolola.tech에서 우리는 최근 tango‑integration‑interapis 프로젝트를 완료했습니다: s와의 통합...
보안은 오랫동안 체크리스트의 마지막 항목이었습니다. 코드가 작성되고, 리뷰되고, 머지된 뒤—그런 다음, 어느 시점에서 보안 팀이 살펴봅니다. 그...
Stencil computations은 과학 컴퓨팅에서 기본적인 kernel이며, 유체 역학 및 기후 모델링과 같은 분야의 시뮬레이션에 필수적입니다. 그러나,…
요약: Akamai는 macOS 및 Linux용 Akamai Guardicore Platform Agent에서 로컬 권한 상승 취약점을 완화했습니다. 수정된 버전은 ...
개요: Google이 최근 발표한 A2UI Agent-to-User Interface는 AI 에이전트가 사용자 인터페이스를 렌더링하는 방식을 위한 표준화된 오픈소스 프로토콜을 도입합니다....
AI 중심 가속기에 대한 투자가 증가하고 슈퍼컴퓨팅 시설에 대한 배치가 확대됨에 따라, 이러한 아키텍처가 효율적으로 …
이전에 문서화되지 않은 Linux 임플란트인 Quasar Linux RAT QLNX가 개발자 시스템을 표적으로 삼아 조용한 foothold를 구축하고 광범위한 r...
대규모 언어 모델(LLMs)의 장기 컨텍스트 학습은 일반적으로 Context Parallelism(CP)와 Head Parallelism(HP)으로 분산되지만, 기존 학습 시스템은…
대형 언어 모델(LLMs)은 추천을 순위 매기기에서 생성 작업으로 전환하고 있지만, 산업 현장 배포는 높은 지연 시간 때문에 제한되고 있습니다.
Agentic reinforcement learning (RL)은 LLM의 다단계 추론 및 도구 사용 능력을 향상시키는 핵심 동력으로 부상했습니다. 그러나 그 효율성은…
Hybrid parallelism은 수만 개의 GPU에 걸친 대규모 LLM 훈련의 기반을 제공합니다. 이러한 규모에서는 개별 장치의 하드웨어 오류가 성능에 영향을 미칩니다...
우리는 TACO라는 툴스위트를 제시합니다. 이는 결함 허용 및 임계값 기반 분산 알고리즘의 개발과 자동 검증을 위한 툴스위트입니다. 우리의 툴스위트는 ...
데이터 병렬(DP) 로드 밸런싱은 대규모 LLM 서비스에서 1차 병목 현상으로 떠올랐습니다. 모델이 텐서 병렬을 통해 디바이스에 샤딩될 때...
Peak breaking Matrix Multiplication은 특히 LLM 학습 및 추론에서 DL의 성능을 향상시키는 유망한 기술입니다. 우리는 FalconGEMM을 소개합니다, ...
Personal access tokens(PATs)는 GitLab에서 실행되는 대부분의 자동화를 인증합니다. 토큰이 api 또는 read_api와 같은 광범위한 범위로 발급되면, 그것은…
탈중앙화 금융(DeFi) 프로토콜은 현재 규제된 스테이블코인과 담보로 활용되는 토큰화 자산을 포함해 1,000억 달러 이상의 가치를 중개하고 있다.
Nsight Compute와 같은 도구가 생성한 GPU 커널의 성능 프로파일은 상세한 정보를 많이 담고 있지만 해석하기가 종종 어렵습니다. 최상의 …
Physical neural networks (PNNs)는 물질 역학에 계산을 직접 내재하여, 분자, 화학, 생물학, photonic, memristive, 그리고 기계적 ...
Sessions는 MPI-4 표준에서 도입된 주요 기능 중 하나입니다. 이는 전통적인 world communicator 모델에 대한 대안을 제공하며, 애플리케이션이 …
엣지 환경에서 연합 학습(Federated Learning, FL)의 급증에 동기를 받아, 우리는 전송 계층 붕괴에 대한 최초의 체계적인 특성화를 제시한다.
특수 아키텍처, 예를 들어 FPGAs와 AMD의 AI Engines(AIEs)와 같은 것이 에너지와 성능 이점을 제공할 잠재력이 있음이 입증되었습니다.
엑사스케일 시스템이 전례 없는 동시성을 달성함에 따라, 기존 성능 분석 도구는 대규모 텔레메트리의 오버헤드로 어려움을 겪고 있습니다. 우리는 …
우리는 모델 o…에서 상당히 super-linear polynomial-time (sequential) 복잡도를 갖는 문제들에 대해 N^{o(1)}-round 프로토콜을 설계할 가능성을 연구한다.
Mozilla는 최근 “The zero-days are numbered”라는 흥미로운 글을 발표했으며, Anthropic과 협력하여 AI 모델을 사용해 vuln을 찾는 데 초점을 맞추고 있습니다.
현대 GPU는 고성능(high performance)을 제공하기 위해 점점 더 특화되고 비동기(asynchronous) 하드웨어 유닛(hardware units)에 의존합니다. 그러나 이러한 유닛은 오늘날 ... 때문에 종종 충분히 활용되지 못합니다.
AI coding tools는 빠르게 발전했지만, 대부분은 여전히 개별 개발자를 중심으로 설계되어 있습니다. 그 효과는 사용자의 w...에 크게 좌우됩니다.
분산형 양자 아키텍처가 등장하기 시작하면서, 양자 회로 최적화와 회로 분할 간의 상호 작용을 이해하는 것이 점점 중요해진다.
kubectl 해킹이 내가 Kubernetes와 작업하는 방식을 바꾼 방법 Selma Guedidi 4월 29일 kubernetes containers devops automation 1 reaction 댓글 달기 12분 읽기
프로덕션 환경에서는 large language model (LLM) 서비스를 제공할 때, 매우 변동성이 큰 요청 패턴 속에서도 엄격한 service-level objectives (SLO)를 충족해야 합니다.
High Performance Computing (HPC)은 기업과 기관에서 매우 수요가 높은 분야입니다. 그러나 학생으로서 그리고 이후에 교수로서 우리는 …
Terraform의 State File 표지 이미지: 무엇이며 왜 중요한가 https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,gravity=auto,format=auto/h...
sreweekly.com에서 보기 https://sreweekly.com/sre-weekly-issue-515/ 왜 Reliability Metrics가 측정하는 시스템보다 더 빨리 오래되는가 > “Is your dashboard always gr...”
Red Hat와 Oracle은 현대 기업에 필수적이며, 전 세계 Fortune 500 기업의 많은 부분이 Red Hat와 Oracle 솔루션을 모두 사용하고 있습니다. 그것은 …
30일간의 Terraform 챌린지 중 29일차는 시험 준비에 집중했습니다. 새로운 인프라를 배포하지 않았으며, 대신 하루 종일 두 개의 추가 Terraform…
!GitGres https://github.com/calebwin/gitgres/raw/main/res/logo.png https://github.com/calebwin/gitgres/blob/main/res/logo.png GitGres는 priv...의 시작점입니다.
분산 시스템에서, 속도 제한(rate limiting)의 가장 큰 과제는 상태(state)입니다. 서로 다른 클러스터 노드에 도달하는 두 개의 병렬 요청이 ‘…’를 하지 않도록 어떻게 보장합니까?
Cleric – Autonomous AI Site Reliability Engineer SRE Clerichttps://cleric.ai/는 소프트웨어의 무거운 작업을 처리하기 위해 최초의 자율 AI SRE를 구축하고 있습니다.
LLM 서빙 시스템의 현실적인 평가를 위해서는 온라인 워크로드, 동적 도착, 큐잉, 그리고 서빙 엔진의 로컬 스케줄링을 통한 실행 배치가 필요합니다.
AI와 클라우드를 활용하면서 디지털 주권 및 주권 AI와 같은 엄격한 프라이버시 규정을 준수하는 데에는 근본적인 긴장이 존재합니다. Encryption of...
복잡한 계산의 효율적인 parallel execution을 위해서는 프로세서 간에 workload를 균형 있게 배분하고 communication을 최소화해야 합니다. This...
스파이킹 뉴럴 네트워크(SNN)는 에너지 효율적인 이벤트 기반 계산을 위한 유망한 패러다임이지만, 대규모 SNN 실행은 여전히 어려운 과제입니다.
SPIFFE Secure Production Identity Framework For Everyone은 워크로드를 위한 보안 아이덴티티 프레임워크를 정의하는 오픈 표준입니다. 원래는 …