[Paper] OpenSeeker: 학습 데이터를 완전 오픈소스화함으로써 프론티어 검색 에이전트를 민주화
Deep search 기능은 최첨단 Large Language Model (LLM) 에이전트에게 필수적인 역량이 되었지만, 고성능 검색의 개발은 …
4526 posts from this source
Deep search 기능은 최첨단 Large Language Model (LLM) 에이전트에게 필수적인 역량이 되었지만, 고성능 검색의 개발은 …
Physics-informed neural networks (PINNs)와 neural operators (NOs)를 사용하여 극자외선 (EUV) 전자기파의 회절 문제를 해결하기 위해 ...
만약 세계 시뮬레이션 모델이 상상된 환경이 아니라 실제로 존재하는 도시를 렌더링할 수 있다면 어떨까요? 이전의 생성적 세계 모델들은 시각적으로 plausible…
Four-dimensional scanning transmission electron microscopy (4D-STEM)은 재료 구조에 대한 풍부하고 원자 규모의 통찰을 제공합니다. 그러나, 구체적인…
본 논문은 전방 반사-후방 분할(FRBS) 방법에 대한 새로운 variance-reduction 기법을 개발하여, 잠재적으로 비단조적인 stochastic 문제의 한 클래스를 해결한다.
추론 시간 컴퓨팅 규모 확대는 LLM 성능의 중요한 동인으로 부상했으며, 추론 효율성을 모델 설계의 핵심 초점으로 만들고 있습니다.
AI 코딩 에이전트가 소스 코드의 주요 생산자이자 소비자가 됨에 따라, 소프트웨어 산업은 제도적 지식의 가속적인 손실에 직면하고 있다. 각각…
우리는 Pokemon의 멀티‑에이전트 전투 시스템과 방대한 롤플레잉을 기반으로 한 decision‑making 연구를 위한 대규모 benchmark인 PokeAgent Challenge를 소개합니다.
이 튜토리얼 논문은 Storm 모델 체커를 활용한 확률적 모델 검증에 대한 실습적인 관점을 제시합니다. Storm은 10년 된 모델 체커로서 뛰어난…
형태론적으로 풍부하고 저자원 언어에 대한 Keyphrase extraction은 적절한 evaluation datasets의 부족으로 인해 크게 연구가 부족한 상태입니다. 우리는 ...
베트남 의료 연구는 특히 시간과 자원을 절감하는 것을 목표로 하는 인공지능 기술의 부상과 함께 점점 더 중요한 분야가 되고 있습니다.
AI 시스템은 눈에 보이는 실패보다 조용히 실패하는 경우가 훨씬 더 많습니다. WildChat 데이터셋을 활용한 인간‑AI 상호작용에 대한 대규모 정량적 분석에서 우리는 …
Agent skills, inference 시점에 주입되는 structured procedural knowledge packages는 소프트웨어 엔지니어링 작업에서 LLM agents를 보강하는 데 점점 더 많이 사용되고 있습니다. Ho...
Internet of Things (IoT)와 스마트 애플리케이션의 급속한 확산으로 분산된 센싱 디바이스가 생성하는 데이터가 급증하고 있습니다. Edge computing…
통신 사업자들이 AI 기반 자동화 도입을 가속화함에 따라, 실질적인 질문이 아직 해결되지 않았습니다: 일반 목적의 large language model …
Research Software Engineering (RSE)의 품질 평가는 모든 과학 분야에서 중요한 역할을 합니다. 전통적인 세 가지 기준(신뢰성, 타당성, …)에 기반합니다.
숙련된 개발자, 특히 보안에 중요한 소프트웨어 개발 분야의 지속적인 부족은 조직이 AI 기반 개발을 점점 더 많이 채택하도록 이끌고 있습니다.
다중 입력 순위들로부터 합의 순위를 집계하는 것은 추천 시스템, 검색 엔진, 인재 채용 등 다양한 분야에서 핵심적인 문제이다. 이 문제는 여러 개별 순위가 주어졌을 때, 이들을 하나의 대표 순위로 통합하는 과정을 의미한다. 대표적인 접근 방식으로는 **Kemeny‑Young** 방법, **Borda count**, **Copeland** 방법, 그리고 **Markov chain** 기반 알고리즘 등이 있다. 각 방법은 순위 간의 거리(metric)를 최소화하거나, 점수 합산을 통해 최적의 순위를 도출한다. **Kemeny‑Young** 방법은 모든 가능한 순열에 대해 총 거리(예: Kendall‑tau distance)를 계산하고, 최소 거리를 갖는 순열을 선택한다. 이 방법은 NP‑hard 문제이지만, 작은 규모에서는 정확한 해를 구할 수 있다. **Borda count**는 각 후보에 대해 순위에 따라 점수를 부여하고, 점수 합산이 가장 높은 후보를 상위에 배치한다. 이는 계산이 간단하지만, 전략적 조작에 취약할 수 있다. **Copeland** 방법은 각 후보가 다른 후보와의 1‑대‑1 대결에서 승리한 횟수를 기반으로 순위를 매긴다. 마지막으로 **Markov chain** 기반 알고리즘은 순위 데이터를 전이 확률 행렬로 변환하고, stationary distribution을 이용해 최종 순위를 추정한다. 실제 응용에서는 데이터의 규모와 특성에 따라 적절한 방법을 선택한다. 예를 들어, 대규모 웹 검색 결과를 통합할 때는 **Markov chain** 기반 방법이 효율적이며, 소규모 설문 조사 데이터에서는 **Kemeny‑Young**이나 **Borda count**가 충분히 정확한 결과를 제공한다. 또한, 최근 연구에서는 **machine learning** 기법을 활용해 순위 합성 모델을 학습시키는 접근도 활발히 진행되고 있다. 이러한 모델은 기존의 규칙 기반 방법보다 복잡한 패턴을 포착하고, 사용자 맞춤형 순위 예측에 강점을 보인다. 요약하면, 다중 순위의 합성은 거리 최소화, 점수 합산, 대결 승리 횟수, 확률 전이 등 다양한 원리를 기반으로 하며, 각 방법은 계산 복잡도와 정확도 사이의 트레이드오프를 제공한다. 실제 시스템 설계 시에는 데이터 규모, 실시간 요구사항, 그리고 전략적 조작에 대한 내성을 고려하여 최적의 알고리즘을 선택하는 것이 중요하다.
멀티 에이전트 LLM 오케스트레이션은 단순 브로드캐스트 하에서 에이전트 수, 단계, 아티팩트 크기에 따라 O(n × S × |D|) 로 동기화 비용이 증가합니다 — 이와 같은 regime은 …
Large Language Models (LLMs)은 코드 생성에 강력한 잠재력을 보여왔지만, 프라이빗 라이브러리 중심의 코드 생성에서는 여전히 제한적이며, 목표는…
GPU 공유는 현대 데이터 센터에서 하드웨어 활용도를 극대화하는 데 필수적입니다. 그러나 기존 접근 방식은 뚜렷한 트레이드오프를 제시합니다: coarse-grained tempo…
디컴파일은 바이너리 분석의 기본이지만, 기존 도구들은 엄격한 재컴파일 가능성과 검증 가능한 런타임 정확성보다 인간 가독성을 우선시합니다.
도로 사고는 예방 가능한 사망 원인 중 여전히 주요 원인입니다. 기존 예측 모델은 주로 binary outcomes를 생성하며, 이는 실질적인 조치를 취하기에 제한적입니다 ...
양자 컴퓨팅은 기존 블록체인 시스템에 실현 가능한 다계층 보안 과제를 제공합니다. 반면, 양자 보안 블록체인은 quantu...
리소스가 제한된 임베디드 시스템에 딥 뉴럴 네트워크(DNN)를 배포하려면 양자화와 프루닝과 같은 공격적인 모델 압축 기술이 필요합니다. H...
엔터프라이즈 소프트웨어 조직은 중요한 제도적 지식을 축적합니다 - architectural decisions, deployment procedures, compliance policies, incident pl...
Spiking Neural Networks (SNNs) 현재 중요한 병목 현상에 직면해 있다: 개별 뉴런은 동적인 생물학적 특성을 보이지만, 그들의 거시적 아키텍처…
고정밀 전산유체역학(CFD) 시뮬레이션은 원자력 발전소 과도 현상을 분석하는 데 널리 사용되지만, 활용할 때 계산 비용이 많이 듭니다.
이 연구는 물리 제약 베이지안 역문제 해결을 위한 조건부 흐름 매칭 프레임워크를 제시한다. 이 설정에서, 공동 분포에서 샘플을 …
자동화된 분할은 화성의 산사태, 특히 Valles Marineris와 같은 구조활동이 활발한 지역에서, 행성 지질학 및 위험에 중요합니다.
우리는 제어된 ‘TV-series’ 선형 동적 시스템에서 알려진 …에 대해 JEPA‑스타일 예측 표현 학습과 재구성 기반 오토인코더를 평가합니다.
이 논문은 GELATO (Government, Executive, Legislative, and Treaty Ontology)를 소개한다. 이는 118번째 의회에서 제출된 미국 하원 및 상원 법안들의 데이터셋이며, ...
이 기사에서는 'Pith Estimation on Rough Log End images using Local Fourier Spectrum Analysis' 방법의 파이썬 구현을 분석하고 제안합니다, b...
클래식 스케일링 법칙은 AI 성능을 모델 크기에 따라 단조롭게 향상되는 것으로 모델링합니다. 우리는 이 가정을 뒤집어 Institutional Scaling Law를 도출합니다.
Low-field magnetic resonance imaging (MRI)는 자원이 제한된 환경에서 의료 영상에 비용 효율적인 대안을 제공합니다. 그러나 그 광범위한 채택은…
Honeypots는 위협 인텔리전스를 수집하기 위해 취약한 서비스를 에뮬레이션하는 기만 시스템입니다. 많은 Honeypots를 배포하면 관찰 기회가 증가합니다.
Low-field magnetic resonance imaging (MRI)은 진단 영상에 대한 저렴한 접근성을 제공하지만, 긴 획득 시간과 감소된 i...
Vision language models (VLMs)는 이미지에 대한 추론 능력이 점점 향상되고 있지만, 견고한 시각적 추론은 종종 중간 단계들을 t...에서 재정립(re‑grounding)하는 것을 필요로 한다.
이미지 초해상도(SR)는 높은 지각 품질과 낮은 왜곡을 동시에 갖춘 고해상도 이미지를 복원하는 것을 목표로 하지만, 근본적으로 …에 의해 제한됩니다.
Sentence simplification은 복잡한 텍스트를 원래 의미를 유지하면서 언어적 복잡성을 줄여 접근성을 높이는 것을 목표로 합니다. 그러나, ...
Contextual sparsity는 대규모 언어 모델(LLMs)의 추론 과정에서 계산 복잡성을 줄이기 위해 사용되는 접근 방식 중 하나입니다. 기존 기술…
기후에 취약한 도로 네트워크는 reactive, fix‑on‑failure 수리에서 predictive, decision‑ready 유지보수로의 paradigm shift가 필요합니다. 이 논문은…
학습된 Transformers는 즉각적인 다음 토큰을 예측하는 데 중복된 것으로 보이는 abstract features를 계산하는 것으로 나타났습니다. 우리는 ...의 구성 요소를 식별합니다.
현대 번역 시스템은 최첨단 성능을 위해 고품질의 대규모 병렬 데이터셋에 크게 의존합니다. 그러나 이러한 자원은 대부분 이용할 수 없습니다.
Stacked AutoEncoders (SAE)는 엣지 이상 탐지 시나리오에서 널리 채택되었습니다. 그러나 SAE의 자원 집약적인 특성은 상당한 도전을 야기할 수 있습니다.
Continuous prompt search는 자연어 처리 작업에서 기존의 parameter tuning에 대한 계산 효율적인 대안을 제공합니다. 그럼에도 불구하고, 그것의…
최근 텍스트 조건부 인간 동작 생성 분야의 진전은 대규모 인간 동작 데이터를 학습한 diffusion models에 크게 의존해 왔습니다. 이를 기반으로 ...
Machine learning 접근법은 spatiotemporal 물리 시스템에 주로 next-frame prediction에 초점을 맞추어, 정확한 emulator f를 학습하는 것을 목표로 해왔습니다.