[Paper] 매치드 몰레큘러 페어 변환을 위한 Retrieval-Augmented Foundation Models, Medicinal Chemistry 직관 재현
Matched molecular pairs (MMPs)는 약물 화학자들이 아날로그를 설계할 때 일상적으로 사용하는 국부적인 화학 편집을 포착하지만, 기존의 ML 접근법은 …
4528 posts from this source
Matched molecular pairs (MMPs)는 약물 화학자들이 아날로그를 설계할 때 일상적으로 사용하는 국부적인 화학 편집을 포착하지만, 기존의 ML 접근법은 …
인간 인식의 핵심적인 측면은 situated awareness, 즉 주변 물리적 환경과 자신을 연결하고 가능한 행동을 추론하는 능력이다.
시계열 이상 탐지(TSAD)는 즉각적인 포인트 이상(Point Anomalies)과 장기적인 컨텍스트 이상(Context Anomalies)을 모두 식별해야 합니다. 그러나 기존 파운데이션 모델은 …
Clustering-based Approximate Nearest Neighbor Search (ANNS)는 점들의 집합을 파티션으로 조직하고, 그 중 일부만 검색하여 가장 가까운 이웃을 찾는다...
C에 대한 Automated unit test generation은 고수준 프로그램 의도와 엄격한 구문 제약 사이의 semantic gap 때문에 여전히 어려운 도전 과제이다.
High-definition (HD) maps는 자율 주행에 필수적이며, 네비게이션 및 플래닝을 지원하기 위해 도로 요소들의 구조화된 표현을 제공합니다. 그러나, ...
AI 에이전트는 중요한 작업을 수행하기 위해 점점 더 많이 배치되고 있습니다. 표준 벤치마크에서 정확도 점수가 상승하고 있는 것이 빠른 진전을 시사하지만, 많은 에이전트는 여전히 …
Adversarial diffusion 및 diffusion-inversion 방법은 비쌍 이미지-이미지 변환을 발전시켰지만, 각각은 주요 제한점에 직면합니다. 적대적 접근 방식은 …
폴리머 문헌은 방대하고 지속적으로 증가하는 실험 지식의 축적을 포함하고 있지만, 그 대부분은 비구조화된 텍스트와 일관되지 않은 용어에 묻혀 있어...
대규모 언어 모델(LLMs)의 급속한 확산은 자연어 처리(NLP)를 혁신했지만 동시에 ‘자원 격차’를 초래했습니다…
희귀 이벤트 샘플링 문제는 오랫동안 분자 동역학(MD), 특히 생체분자 시뮬레이션에서 핵심적인 제한 요인으로 작용해 왔습니다. 최근에는 diffusion...
인간은 시각적 외관을 통해 물체의 재질 특성을 추론할 수 있으며, 이러한 능력은 예술적 묘사에도 확장되어, 유사한 지각적 ...
Large language models (LLMs)은 자연어 생성 평가를 위한 자동 평가자로 점점 더 많이 적용되고 있으며, 종종 쌍별 비교 판단을 사용합니다.
현재 최첨단 멀티-벡터 모델은 강력한 싱글-벡터 모델 위에 작은 Knowledge Distillation (KD) 훈련 단계를 추가하여 얻어집니다, lever...
Municipal meeting minutes는 지방 정부의 토론과 결정을 기록한 공식 기록이지만, 그 내용은 종종 길고, 밀도가 높으며, 이해하기 어렵다…
대규모 언어 모델(LLMs)에 대한 수요가 증가함에 따라, 서빙 시스템은 다양한 서비스 수준 목표(SLOs)를 가진 다수의 동시 요청을 처리해야 합니다. Th...
Asset Administration Shell (AAS)은 제조 분야에서 디지털 트윈을 구현하기 위한 신흥 기술입니다. 소프트웨어는 점점 ...
Federated Learning (FL)은 클라이언트의 개인 데이터를 노출하지 않고 협업 모델 학습을 가능하게 하며, 프라이버시가 민감한 상황에서 널리 채택되고 있습니다....
Extreme Edge Computing (XEC)은 스트리밍 워크로드를 소비자 소유 디바이스에 분산시켜, 사용자와의 근접성 및 언제 어디서나 이용 가능한 점을 활용합니다. Man...
Meshless methods는 부분 미분 방정식을 풀기 위해 노드에서 미분 연산자를 이웃값들의 가중합으로 근사함으로써 사용됩니다.
Zero-knowledge proof 생성은 블록체인 시스템에 엄격한 타이밍 및 신뢰성 제약을 부과합니다. ZK-rollups의 경우, 증명이 지연되면 최종성 지연을 초래합니다…
PyPI와 같은 오픈소스 저장소에서 악성 패키지가 널리 퍼져 있는 것은 소프트웨어 공급망에 중대한 위협을 초래합니다. While Large Language Model...
우리는 희소 상호작용 그래프에서 인구 프로토콜의 공간‑시간 트레이드오프를 조사한다. 완전 상호작용 그래프에서는 최적의 공간‑시간 트레이드오프가 …
대규모 언어 모델(LLM)의 급속한 발전과 함께, 제한된 GPU 자원 하에서 LLM 추론을 효율적으로 제공하는 것이 중요한 과제가 되었습니다. 최근...
빠르게 증가하는 컨텍스트 길이는 대형 언어 모델(LLMs)이 전체 코드베이스에 대해 직접 추론할 수 있다는 가정을 낳았습니다. 동시에, 최근 …
Checkpoint/Restart (C/R)는 프로그램의 실행 상태를 주기적으로 저장하는데, 이는 상당한 시스템 자원을 소비합니다. 우리는 모든 조각이 …
Large language models (LLMs)은 자연어를 optimization code로 변환할 수 있지만, silent failures는 심각한 위험을 초래합니다: 실행되고 sol…을 반환하는 코드.
Superficial alignment hypothesis (SAH)는 대형 언어 모델이 사전 훈련 동안 대부분의 지식을 학습하고, 사후 훈련은 단지 …
최근 humanoid locomotion 분야의 발전으로 다양한 지형에서 안정적인 보행을 구현했지만, 매우 역동적인 인간 움직임의 agility와 adaptivity를 포착하는 데는 아직 한계가 있다.
Machine learning surrogates는 비용이 많이 드는 시뮬레이션을 가속화하기 위해 엔지니어링 분야에서 점점 더 많이 사용되고 있지만, training과 deployment 사이의 distribution shifts가 종종…
스케치 작업은 본질적으로 순차적인 과정으로, 스트로크가 의미 있는 순서대로 그려져 아이디어를 탐색하고 다듬는다. 그러나 대부분의 생성 모델은...
최근 딥 강화학습(RL)의 발전은 고차원 제어 작업에서 강력한 성과를 거두었지만, RL을 도달 가능성 문제에 적용하는 것은 ...
흉부 방사선 사진 분류기( chest radiograph classifiers )의 임상 배포를 위해서는 새로운 데이터셋(datasets)이 제공될 때 이전에 관찰된 데이터에 대해 재학습 없이 모델을 업데이트할 수 있어야 합니다.
Fine-tuning aligned language models를 benign 작업에 적용하면, safety guardrails가 예측할 수 없이 약화되고, 훈련 데이터에 해로운 콘텐츠가 없으며 개발자들이 ...
Computing Continuum (CC)은 Edge에서 Cloud까지 다양한 처리 인프라 계층을 통합하여, 어디서나 이용 가능한 서비스 품질을 최적화합니다. ...
점점 늘어나는 문헌에서는 대형 언어 모델(LLMs)을 합성 참가자로 활용하여 사회과학에서 비용 효율적이고 거의 즉각적인 응답을 생성한다.
전통적인 에너지에 대한 대안으로 재생 가능 에너지, 특히 태양광 에너지의 사용이 증가함에 따라, 이에 대한 연구 관심이 높아지고 있다.
대규모 언어 모델(LLMs)의 성공은 모델 용량과 데이터셋 규모를 동시에 늘리는 방식으로 컴퓨팅을 확장하는 것이 주요 동인임을 입증했습니다.
Endoscopy는 의료 영상에서 필수적이며, 진단, 예후 및 치료에 사용됩니다. 견고한 dynamic 3D reconstruction pipeline을 개발하는 것은 endoscopic vi...
멀티모달 모델에 대한 현재 연구는 generative capabilities를 향상시키면 understanding이 희생되는 경우가 많고, 그 반대도 마찬가지인 핵심적인 과제에 직면해 있습니다.
멀티모달 대형 언어 모델(mLLMs)은 종종 마크다운, JSON, 이미지와 같은 구조화된 데이터의 표에서 질문에 답하는 데 사용됩니다. 이러한 모델은 …
이 논문은 RaCo라는 경량 신경망을 소개한다. 이 신경망은 다양한 3D 컴퓨터 비전 작업에 적합한 견고하고 다목적 키포인트를 학습하도록 설계되었다. Th...
Low-resource languages는 Natural Language Processing 작업, 예를 들어 lemmatization 및 part-of-speech (POS) tagging과 같은 작업에서 지속적인 도전을 제기합니다. 이 논문은 ...
기존 3D 오픈-보카뷸러리 씬 언더스탠딩 방법들은 주로 2D 파운데이션 모델에서 언어 특징을 추출해 3D 특징 필드에 증류하는 데 중점을 두지만, 대규모...
Visual analogy learning은 텍스트 설명이 아니라 시연을 통해 이미지 조작을 가능하게 하며, 사용자가 복잡한 변환을 지정할 수 있도록 합니다.
대형 언어 모델은 많은 복잡한 추론 작업에서 강력한 성능을 달성하지만, 구성적 추론을 요구하는 벤치마크에서는 정확도가 급격히 감소합니다.
비즈니스 플랜(BP) 작성은 기업가 정신 교육에서 학습자들이 아이디어를 구축하고 평가하며 반복적으로 다듬는 데 핵심적인 역할을 합니다. 그러나, ...
Software-Defined Vehicles에서 기능을 테스트하는 것은 요구사항이 자연어로 작성되고, 사양이 텍스트, 표 및 …