[Paper] 스케줄링할 수 없는 것을 스케줄링하기: 대규모에서 블랙박스 LLM 추론을 제어하기
출력 토큰 수를 제출 시점에 예측할 수 있을 때 (Gan et al., 2026), 블랙박스 LLM API에 대한 클라이언트 측 스케줄링은 반예지적이 된다: de...
출력 토큰 수를 제출 시점에 예측할 수 있을 때 (Gan et al., 2026), 블랙박스 LLM API에 대한 클라이언트 측 스케줄링은 반예지적이 된다: de...
이 논문에서는 SOS 작업( Set of Output Sets tasks )이라고 하는 새로운 클래스의 분산 작업을 정의합니다. 이는 값들의 서로 다른 출력 집합들의 집합 O에 의해 정의됩니다.
Claude Mythos의 프리뷰 릴리스는 IT‑security 전문가들에게 거대한 도전을 제시하며, 최소한 이를 활용할 수 있는 조직들에게는 기회를 제공합니다.
개요: 올해 Red Hat Summit 2026은 애틀랜타에서 열리며, 그 어느 때보다 hands‑on하고 interactive한 경험을 제공합니다! 여러분이 오래된 참석자이든...
Modern exascale GPU- 및 APU 기반 시스템은 여러 power 및 energy sensors를 제공하지만, scope, update rate, timing, filtering의 차이로 인해 복잡해진다.
개요 프로젝트에서 작업하고, 명령을 실행하고, 패키지를 설치하고, 저장소를 살펴보는 에이전트를 원하지만, 리소스에 직접 접근하고 싶지 않은 날이 있습니다.
Graphics Processing Units (GPUs)는 대규모 하드웨어 병렬성을 쉽게 활용할 수 있는 정규 데이터 병렬 워크로드에서 뛰어납니다. 반면에, 많은 importa...
spatial tree traversal 기반 알고리즘은 CPU 기반 고성능 환경에서 많은 문제에 대해 가장 효율적이고 유연한 접근 방식 중 하나로 널리 인정받고 있습니다.
AI‑assisted low‑code 도구인 VibeCode와 같은 도구는 앱 개발 속도를 높이지만, DevOps 팀은 보안, 품질 및 CI/CD 통합을 보장해야 합니다....
AI 코딩 세계에서 성공은 코드‑native 솔루션에 달려 있으며, 이는 변경 사항을 코드베이스에 직접 통합하고 검증합니다. 많은 AI 도구는 ...에 의존함으로써 실패합니다.
서버리스 컴퓨팅, 특히 Function-as-a-Service(FaaS)는 인프라 관리 추상화와 동적…
우리는 최근 일반 가용성(GA)을 발표했습니다 https://www.redhat.com/en/blog/general-availability-managed-identity-and-workload-identity-microsoft-azure-red-...
소개 Arm 기술은 이제 온프레미스와 클라우드 서버 워크로드의 광범위한 스펙트럼을 구동합니다. Ampere Computing의 이전 레퍼런스 아키텍처를 기반으로…
Blockchain 생태계는 liquidity fragmentation이라는 중대한 문제에 직면해 있습니다. 애플리케이션과 자산이 여러 public chains에 분산되어 있으며, 각 체인은 오직...
Optimistic rollups는 확장 가능한 스마트‑contract 실행을 제공하지만, 규제된 금융 애플리케이션에 적합하지 않은 세 가지 구조적 격차가 있다: semantic l...
GPU는 데이터 센터 전력 소비의 주요 기여자가 되고 있지만, CPU와 달리 눈에 보이는 활동이 거의 없을 때도 높은 전력을 유지할 수 있습니다. 우리는 이를…
우리는 단일 에이전트에 의한 deterministic exploration을 T‑interval‑connected 그래프에서 연구한다. 이는 동적 네트워크의 표준 모델로, 모든 길이 len의 time window에 대해 …
NBI‑Slurm은 SLURM 고성능 컴퓨팅(HPC) 클러스터에서 작업을 제출하고 관리하기 위한 간소화된 사용자 친화적 인터페이스를 제공하는 Perl 패키지입니다.
소개 나는 최근에 Kubernetes(K8s) 클러스터 문제를 디버깅하다가 그것이 보안 취약점이라는 사실을 알게 되었다. 이번 경험은 K8…
Adversarial QA testing은 실제 환경에서 AI agents를 검증하는 데 도움이 되며, prompt injection 및 logic failures와 같은 위험을 드러냅니다....
sreweekly.com에서 보기 https://sreweekly.com/sre-weekly-issue-511/ 시각이 없거나 약한 분들을 위해, Vanessa Huert를 인용한 J. Paul Reed의 스크린샷이 있습니다.
파일 시스템 탐색기 !File System Explorerhttps://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fo...
블록체인 상의 자율 소프트웨어 에이전트는 직접 메시지를 교환하는 대신 공유 원장 상태를 읽음으로써 분산 협조 문제를 해결합니다. Liquidat...
DAG‑Rider는 DAG‑BFT 프로토콜의 새로운 패러다임을 대중화했으며, 전파와 합의를 분리했습니다: 모든 노드는 트랜잭션을 블록 형태로 전파하고, 그 블록은 다른 블록을 reference합니다.
번역할 텍스트를 제공해 주시겠어요? 해당 내용이 없으면 번역을 진행할 수 없습니다.
멀티 에이전트 LLM 애플리케이션은 중앙 스케줄러가 모든 에이전트의 출력을 수집하고 결합된 …을 재분배하는 동기화된 라운드에서 실행을 조직합니다.
replicated data systems의 consistency models에 대한 추론은 consistency models 자체에 대한 깊은 이해를 필요로 하는 어려운 작업이다.
번역할 텍스트를 제공해 주시겠어요? 현재 메시지에 텍스트가 포함되어 있지 않아 번역이 어렵습니다.
Memory-disaggregated key-value (KV) 스토어는 I/O 중복 문제로 인해 심각한 성능 병목 현상을 겪는다. 엄청난 양의 중복 I/O가 g...
엔드포인트 탐지 및 대응(EDR) 플랫폼을 제공하는 Bitdefender의 사이버 보안 연구원들은 Windsur에 대한 악성 확장 프로그램을 발견했습니다.
Multimodal large language models (MLLMs)는 강력한 크로스모달 추론 능력을 가능하게 하지만, 상당한 계산 및 지연 부하를 초래하여 중대한 ...
확장 현실(XR)의 발전은 메타버스 개발을 촉진하고 있으며, 이는 2D 장면을 3D 객체로 효율적으로 실시간 변환하는 것을 요구합니다.
Azure Global Black Belts인 Diego Casati와 Ray Kao는 AKS와 ARO에 대한 심층 기술 연구를 자동화하는 다중‑에이전트 시스템인 Project Nighthawk를 개발했습니다…
Legacy software는 스스로 퇴역하지 않는다. 그것은 production에 남아 technical debt를 축적하고, 변화를 거부하며, 조용히 risk가 된다—그것이 …
몇 년 전, 나는 내가 뭘 하고 있는지 안다고 생각했다. 나는 방금 풀스택 앱을 만들었는데—프론트엔드에 React, 백엔드에 Node.js를 사용했다. 그것은 완벽하게 작동했다...
우리는 모든 노드가 익명인, extremely weak models of distributed computing에서 random input graphs에 대해 deterministic distributed algorithms가 무엇을 계산할 수 있는지를 연구한다.
클라우드 인프라스트럭처는 비용, 속도, 자원 활용과 같은 요구 사항에 대해 데이터 파이프라인의 효율적인 운영을 지원합니다. We present an integra...
Open source 채택이 급증하고 있으며, IT 팀의 49 %가 사용량을 늘리고 있습니다. 그러나 직원의 47 %가 시간의 75 %를 유지보수에 할애하고 있습니다. A…
Range minimum queries는 문자열 처리와 데이터베이스 응용 프로그램에서 자주 사용되며, 생물학적 서열 분석, 문서 검색, 웹 …
AI는 불필요한 복잡성을 추가하지 않으면서 CI/CD 워크플로우, DORA 메트릭, 그리고 보안을 개선함으로써 DevOps와 DevSecOps를 재구성하고 있습니다....
개요 인증은 API에서 가장 먼저 문제가 발생하는 경우가 많습니다. 단일 HTTP 체크로 엔드포인트가 200 OK를 반환하는지 확인할 수 있지만, 세부적인 …를 포착하지는 못합니다.
이 논문은 대규모 선형 방정식을 풀기 위한 분산 변분 양자 알고리즘을 개발한다. Ax = b 형태의 선형 시스템에 대해, 큰 정사각형…
여러분, 안녕하세요! 👋 TL;DR 저는 django‑sysconfig이라는 런타임 설정 Django 앱을 만들었습니다. https://github.com/krishnamodepalli/django-sysconfig. !Django Sysconfig...
Gaussian processes는 machine learning 분야에서 널리 사용되지만 계산적으로 부담이 커서 다양한 하드웨어에 대한 효율적인 확장성을 제한합니다.
클래식-양자 시스템 이질성(다양한 데이터 특성, 실행 패러다임 및 동기화 메커니즘 등)은 기존 분산…
MPI-병렬 시뮬레이션이 공유 Kubernetes 클러스터에서 실행될 때, 기존 CPU 스케줄링은 동기화 시 대부분의 할당된 사이클을 유휴 상태로 남깁니다.
현대 GPU 클러스터는 다중 레일 RDMA부터 Multi-Node NV와 같은 독점 패브릭에 이르기까지 이질적인 인터커넥트의 복잡한 계층 구조 위에 구축됩니다.