[Paper] SymSeqBench: 규칙 기반 심볼릭 시퀀스 및 데이터셋 생성과 분석을 위한 통합 프레임워크
순차적 구조는 언어, 움직임, 의사결정과 같은 자연 인지 및 행동의 여러 영역에서 핵심적인 특징입니다. 마찬가지로, 이것은 또한...
3232 posts from this source
순차적 구조는 언어, 움직임, 의사결정과 같은 자연 인지 및 행동의 여러 영역에서 핵심적인 특징입니다. 마찬가지로, 이것은 또한...
우리는 다양한 출처의 영어 텍스트에서 장거리 구조를 밝혀내기 위해 대형 언어 모델(LLMs)을 사용합니다. 많은 경우에서 조건 엔트로피 또는 코드 길이는 ...
정확하고 해석 가능한 작물 질병 진단은 농업 의사결정에 필수적이지만, 기존 방법들은 종종 비용이 많이 드는 감독된 파인튜닝에 의존한다...
검색 관련성은 웹 전자상거래에서 핵심적인 역할을 합니다. 대형 언어 모델(LLMs)이 관련성 작업에서 상당한 성과를 보여준 반면, 기존 벤치마크는…
Railway ticketing system은 가장 중요한 공공 서비스 인프라 중 하나입니다. 휴일과 같은 피크 기간에는 종종 도전에 직면합니다 ...
우리는 이전 모델의 배포에서 사용자가 신중하게 선별한 데이터를 기반으로 각각 미세 조정된 대규모 언어 모델(LLMs)의 반복적 배포가 …
현대 cloud-native 시스템은 확장성, 복원력 및 지리적 분산을 지원하기 위해 multi-cluster 배포에 점점 더 의존하고 있습니다. 그러나 기존의 ...
단일 장치를 넘어 양자 컴퓨팅을 확장하려면 많은 양자 처리 유닛(QPUs)을 네트워킹하여 일관된 양자‑HPC 시스템을 구축해야 합니다. 우리는 Mod...
Web3 기술의 분산 아키텍처는 Anti-Money Laundering 및 Counter-Financing of Terrorism 준수에 근본적인 과제를 제기합니다. Trad...
function similarity를 측정하여 bugs를 탐지하는 것은 효과적이지만, bugs와 무관한 statements는 noise interference 때문에 performance를 저해할 수 있다.
Neural architecture search(NAS)는 딥 뉴럴 네트워크(DNN)의 아키텍처 설계 과정을 자동화하는 것으로, 점점 더 많은 관심을 받고 있다. 멀티모달…
Deep neural networks (DNNs)는 입력 이미지에 특정 perturbations가 추가될 때 misclassification을 일으키는 adversarial attacks에 여전히 취약합니다. This vu...
hippocampus는 뇌에서 두 가지 핵심적이지만 매우 구별되는 기능을 구현하는 것으로 보인다: long term memory retrieval와 planning 및 spatial navigation. Naivel...
대규모 모델이 개발됨에 따라, 기존의 distributed bilevel optimization algorithms는 low-resource clients에 직접 적용할 수 없습니다. 핵심 …
Quantum Software Engineering (QSE)은 하이브리드 양자‑클래식 시스템의 신뢰성 및 유지보수성을 보장하는 데 필수적이지만, 이에 대한 실증적 증거는 …
소프트웨어 엔지니어링이 새로운 시대(SE 3.0)에 접어들면서, AI 코딩 에이전트가 소프트웨어 개발 워크플로우를 점점 자동화하고 있다. 그러나 정확히 어떻게…
Automated Program Repair (APR)은 버그가 있는 프로그램에 대해 자동으로 올바른 패치를 생성하는 것을 목표로 합니다. 최근 large language models (LLMs)를 활용한 접근 방식은...
LLM 기반 소프트웨어 엔지니어링은 현대 소프트웨어 개발에 영향을 미치고 있습니다. 정확성 외에도, 이전 연구들은 소프트웨어의 성능도 조사했습니다.
대규모 소프트웨어 및 하드웨어 시스템의 완전 자동 검증은 형식 방법(formal methods)의 성배라고 할 수 있습니다. Large language models (LLMs)는 최근…
대형 언어 모델(LLMs)은 코드 생성에서 눈에 띄는 진전을 이루었으며, 이는 주로 고품질 코드 데이터셋의 가용성에 의해 효과적으로 촉진되었습니다.
대규모 언어 모델(LLMs)은 자연어 프롬프트로부터 복잡한 소스 코드를 생성할 수 있습니다. 그러나 LLMs은 사용자가 기대하는 것과 다른 출력을 생성할 수 있습니다.
우리는 genetic programming 접근법을 사용하여 neutron transport 문제의 discrete ordinates 해법에 대한 convergence acceleration methods를 자동으로 발견한다.
LLM과 foundation model이 규모가 커짐에 따라, checkpoint/restore는 학습 및 추론에 있어 중요한 패턴이 되었습니다. 3D parallelism(tensor, pipeline, data)과 함께, ...
Recurrent networks는 일반적으로 backpropagation through time (BPTT)으로 학습됩니다. 그러나 BPTT는 네트워크 내 모든 상태의 히스토리를 저장해야 하며 t...
부동산 부문은 여전히 manual document handling 및 verification에 크게 의존하고 있어, processes가 비효율적이며 fraud에 취약합니다. 이 연구는…
Transformer 기반 대형 언어 모델(LLMs)은 다양한 실용 애플리케이션에서 놀라운 잠재력을 입증했습니다. 그러나, 긴 컨텍스트 추론…
Live video analytics (LVA)는 대규모 카메라 플릿에서 지속적으로 실행되지만, 최신 비전 모델을 사용한 추론 비용은 여전히 높습니다. 이를 해결하기 위해, dynamic m...
Federated Learning (FL)은 모바일 엣지 디바이스를 클라이언트로 활용하여 로컬 데이터 프라이버시를 보장하면서 분산 모델을 공동으로 학습할 수 있게 합니다. H...
시뮬레이션 최적화(SO)는 종종 노이즈가 섞인 평가, 높은 계산 비용, 그리고 복잡하고 다중모달인 탐색 환경으로 인해 어려움을 겪는다. 이 논문은 …
실제 세계의 Constrained Multi-objective Optimization Problems (CMOPs)는 종종 여러 제약을 포함하고 있으며, 제약들 간의 결합을 이해하고 활용하는 것이…
ocular fixations와 saccades의 특성은 많은 실험 과제에서 매우 확률적이며, 그 통계는 종종 다양한 asp...의 대리 지표로 사용됩니다.
Diffusion-based video super-resolution (VSR) 방법은 강력한 perceptual quality를 달성하지만, ...에 대한 의존으로 인해 latency-sensitive settings에서는 실용적이지 않습니다.
AI co-scientists는 인간 연구자들이 연구 목표를 달성하도록 돕는 도구로 부상하고 있습니다. 이러한 AI co-scientists의 핵심적인 특징은 능력…
투명한 물체는 인식 시스템에게 여전히 악명 높게 어려운 문제입니다: refraction, reflection 그리고 transmission이 stereo, ToF 및 순수 …
대규모 언어 모델(LLMs)에서 특정하고 종종 복잡한 행동을 대화 환경에서 식별하는 것은 그들의 평가에 필수적입니다. 최근 연구는…
우리는 Iterated Bellman Calibration을 도입한다. 이는 단순하고 모델에 구애받지 않으며 사후(post-hoc) 절차로, 무한‑시간 지평선 마코프에서 오프‑정책 가치 예측을 보정한다.
우리는 feedback-driven improvement chains를 사용한 선호도 감독으로 언어 모델을 미세 조정하기 위한 방법과 데이터셋을 제시합니다. 모델 응답이 주어지면, ...
전문적인 환경에서의 자동 음성 인식(ASR)은 기존 벤치마크가 과소평가하는 도전에 직면합니다: 밀집된 도메인 용어, 격식 있는 레지스터 변동...
대형 언어 모델(LLMs)은 학술 동료 검토를 포함한 고영향 작업 흐름에 점점 더 많이 사용될 것으로 고려되고 있습니다. 그러나 LLM은 문서...
언어 에이전트는 점점 더 행동하고, 기억하고, 학습할 수 있는 지속적인 세계를 필요로 합니다. 기존 접근 방식은 두 극단에 놓여 있습니다: 기존 웹 fra...
우리는 long-context language modeling을 architecture design이 아니라 continual learning 문제로 정의합니다. 이 정의에 따라 우리는 standard …
우리는 여러 분위수 수준에서 동시에 분위수 예측의 보정을 보장하는 온라인 방법을 제시한다. α‑level 분위수 예측 시퀀스…
우리는 random features와 controlled differential equations (CDEs)를 결합한 시간 시계열 학습을 위한 학습 효율적인 프레임워크를 소개합니다. 이 접근...
Intrinsic image decomposition은 시각적 이해에 기본적이며, RGB 이미지가 물질 특성, 조명, 그리고 시점 의존 효과를 얽혀 있기 때문입니다. Rec...
이 논문의 주요 연구 질문은 관계를 조사할 때 필요한 및/또는 적절한 맥락의 양을 정의하는 데 초점을 맞추고 있다.
인간은 시각 관찰을 통해 보행을 학습하며, 먼저 시각적 내용을 해석한 뒤 행동을 모방합니다. 그러나 최첨단 인간형 로봇 보행 시스템은…
Information-seeking (IS) agents는 광범위하고 깊이 있는 검색 작업 전반에 걸쳐 강력한 성능을 달성했지만, 그들의 도구 사용은 여전히 크게 제한되어 있습니다...
Omnimodal large language models는 audio와 visual modalities를 통합하는 데 큰 진전을 이루었지만, 종종 세밀한 cross-modal 이해가 부족합니다.