[Paper] 대형 언어 모델에서 의회 투표 기록을 활용한 정치적 편향 탐지
대형 언어 모델(LLM)이 디지털 플랫폼과 의사결정 시스템에 깊이 통합됨에 따라, 그들의 정치적 편향에 대한 우려가 커지고 있습니다. 반면…
4613 posts from this source
대형 언어 모델(LLM)이 디지털 플랫폼과 의사결정 시스템에 깊이 통합됨에 따라, 그들의 정치적 편향에 대한 우려가 커지고 있습니다. 반면…
Machine Learning 알고리즘은 정의, 의료 및 금융과 같은 핵심 의사결정 분야에 널리 퍼져 있어, fairness에 대한 큰 수요를 촉발했습니다.
CLASSIX 알고리즘은 데이터 클러스터링에 대한 빠르고 설명 가능한 접근 방식입니다. 원래 형태에서는 이 알고리즘이 데이터 포인트를 정렬하는 방식을 활용합니다.
연구자들은 데이터 분석을 간소화하고 데이터베이스 기반 애플리케이션 개발을 가속화하기 위해 수많은 text-to-SQL 기술을 제안했습니다. 비교를 위해...
다양하고 잠재적으로 상충되는 선호를 가진 사용자들에게 서비스를 제공하도록 대형 언어 모델(LLMs)을 정렬하는 것은 개인화 및 신뢰성 측면에서 핵심 과제이다.
조직병리학 분석은 헤마톡실린 및 에오신(H&E) 염색에 의존하지만, 형광 현미경은 보완적인 정보를 제공합니다. 형광을 변환하는…
소프트웨어 엔지니어링을 위한 Retrieval-Augmented Generation은 종종 vector similarity search에 의존하는데, 이는 주제 유사성을 포착하지만 다중 홉 …
강화 학습(RL)은 특히 복잡한 추론 작업에 대해 사후 훈련된 대형 언어 모델(LLMs)의 핵심 패러다임이 되었지만, 종종…
우리는 edge networks로 구성된 환경에서 time-sensitive clients의 information freshness를 최적화하는 것을 목표로 하는 decentralized collaborative requesting problem을 연구한다.
Chain-of-Thought (CoT) 추론은 단계별 중간 추론을 장려함으로써 대규모 언어 모델을 향상시키는 데 효과적인 것으로 입증되었으며, 최근의 발전…
최근 natural language processing의 발전은 텍스트를 생태학을 위한 새로운 데이터 소스로 부각시킨다. 텍스트 자원은 고유한 정보를 담고 있어…
현재 컨텍스트 증강 방법, 예를 들어 retrieval-augmented generation과 같은 방법은 지식 집약적 추론 작업을 해결하는 데 필수적입니다.하지만, 그들은 일반적으로...
Text-to-SQL 작업에서 기존 LLM 기반 방법은 종종 프롬프트에 방대한 데이터베이스 스키마를 포함하여, 긴 컨텍스트 길이와 증가된 prefilling 비용을 초래합니다.
Attributional inference, 관찰된 행동 뒤에 있는 latent intentions를 예측하는 능력은 large language models에게 중요한 동시에 아직 충분히 탐구되지 않은 역량이다 ...
대규모 언어 모델(LLMs)은 수천 개의 숫자 행과 여러 연결된 시트가 포함된 대규모 기업 스프레드시트를 추론하는 데 어려움을 겪으며, 임베드…
Infrastructure-as-Code (IaC)를 자동화하는 것은 어려우며, 대형 언어 모델(LLMs)은 종종 자연어(NL)로부터 잘못된 구성을 생성합니다. 우리는 …
인공지능(AI) 시스템은 분류 작업에서 좋은 성공을 보여왔습니다. 그러나 explainability의 부족은 특히 진정하고 중요한 도전 과제입니다.
우리는 Yuan 등(2023년 ICSE)에서 제시한 최신 DNN 커버리지 기준인 Neural Coverage(NLC)에 대한 비판적 리뷰를 제시한다. NLC는 여덟 가지를 만족시키려고 제안한다.
강화 학습(Reinforcement Learning, RL)은 머신러닝에서 중심적인 최적화 프레임워크로 남아 있습니다. RL 에이전트가 최적 솔루션에 수렴할 수 있지만, 정의는...
양자 어닐링(QA)은 조합 최적화를 위해 개발되었지만, 실제 QA 장치는 유한 온도와 잡음 하에서 동작하며, 그들의 …
우리는 분산 컴퓨팅 클러스터에서 matrix chain multiplications을 계산하는 문제를 연구한다. 이러한 시스템에서는 성능이 종종 straggle에 의해 제한된다.
오늘날 복잡한 산업 환경에서, 운영자들은 종종 방대한 technical manuals를 탐색하여 문제 해결 절차를 식별해야 합니다.
Neural Combinatorial Optimization (NCO)는 주로 단일 후보 솔루션에 대해 한 번에 작동하는 정책, 일반적으로 neural networks, 을 학습하는 데 초점을 맞추어 왔습니다.
전통적인 소프트웨어 보안 분석 방법은 현대 코드베이스의 규모와 복잡성을 따라잡기 어려워, 지능형 자동화가 필요합니다.
신경망 아키텍처를 진화시키는 것은 계산적으로 많은 자원을 요구하는 과정이다. 전통적인 방법은 종종 대규모 아키텍처를 광범위하게 탐색해야 한다...
자율 주행 보조 시스템(ADAS)은 안전성과 신뢰성을 보장하기 위해 광범위한 테스트에 의존하지만, 도로 시나리오 데이터셋에는 종종 중복된 사례가 포함되어 있습니다.
프로그래밍 분야에서 대규모 언어 모델(LLMs)의 개발과 함께, 지능형 프로그래밍 코칭 시스템이 널리 주목받고 있습니다. How...
Spike-Timing-Dependent Plasticity (STDP)는 스파이킹 신경망(SNN)에 대한 생물학적으로 기반한 학습 규칙을 제공하지만, 정확한 스파이크 타이밍에 의존한다...
Conversational agents는 정신 치료 경로에서 지원 도구로 점점 더 많이 사용되고 있으며, 이는 사회에 큰 영향을 미칩니다. 특히, empathy는 핵심 요소입니다.
Spike-timing-dependent plasticity (STDP)는 스파이킹 신경망 (SNN)을 위한 생물학적으로 타당한 학습 메커니즘을 제공한다; 그러나 Hebbian weight update…
탄성에 대한 고차 유한 요소 분석에서, 매트릭스-프리(matrix‑free, PA) 방법은 전통적인 Full Assembly의 메모리 병목 현상을 극복하기 위한 핵심 기술이다.
양자 소프트웨어 엔지니어링(QSE)에서, 양자 소프트웨어 테스트(QST)는 양자 소프트웨어 시스템이 규모와 복잡성이 증가함에 따라 점점 더 많은 관심을 받고 있다.
Particle-in-Cell (PIC) 시뮬레이션은 실행 시간의 대부분을 입자‑그리드 상호작용에 소비하며, 여기서 세밀한 atomic 업데이트가 주요 병목이 된다...
스마트 홈에서 IoT 센싱 장치가 수집한 데이터를 처리하여 일상 생활 활동(Activities of Daily Living, ADLs)을 비침해적인 센서 기반으로 인식하는 것은 응용을 지원한다.
Device‑edge 협업 추론은 Deep Neural Networks (DNNs)에서 accuracy, latency 및 energy consumption 사이의 근본적인 trade‑off에 직면합니다. Current scheduling…
AI 데이터센터는 현재 대규모로 배치되어 전력 집약적인 대형 언어 모델(LLMs)의 학습 및 배포를 지원하고 있습니다. Extensi...
Symmetric linear solves는 기후 모델링과 구조 해석에서 머신 러닝에 이르기까지 광범위한 과학 및 공학 응용 분야의 기본이다.
딥 뉴럴 네트워크(DNN)를 자원 제한이 있는 엣지 디바이스에 배포하는 것은 그들의 상당한 계산 및 메모리 요구사항 때문에 자주 방해받는다.
Large Language Models는 Security Operations Centers에 변혁적인 도구로 등장했으며, automated log analysis, phishing triage, 그리고 malware …을 가능하게 합니다.
우리는 지정된 시간 의존적 주변 분포를 가진 모든 stochastic differential equation이 세 구성 요소로 분해될 수 있음을 보여준다: 고유한 s...
우리는 RefVFX라는 새로운 framework을 제시한다. 이 framework은 복잡한 temporal effects를 reference video에서 target video 또는 image로 feed‑forward manner로 전달한다.
Transformer 아키텍처가 많은 분야를 장악하고 있지만, 그 이차적인 self-attention 복잡도는 대규모 응용에서의 사용을 방해한다. Linear attention ...
효율적으로 배우는 방법을 학습하는 것은 생물학적 에이전트에게는 근본적인 도전 과제이며 인공 에이전트에게는 점점 더 큰 관심사이다. 효과적으로 배우기 위해, 에이전트는 ...
deep reinforcement learning 기반 사후 훈련 알고리즘은 generalizability, accuracy와 같은 특정 목표에 대해 robotic models의 한계를 확장할 수 있다...
인간 대화에서, 두 interlocutor는 상호 이해(mutual understanding)를 유지하는 데 적극적인 역할을 합니다. 청자(addressees)가 화자(speakers)의 의미에 대해 확신이 없을 때, ...
대형 비전 언어 모델(LVLMs)은 놀라운 능력을 입증했지만, 다중 이미지에 대한 이해와 추론 능력은 여전히…
민감한 분야에서 Large Language Models (LLMs)의 사용이 증가함에 따라, 그들의 confidence scores가 fairness와 bias에 어떻게 대응하는지에 대한 관심이 커지고 있다....
Remote sensing change detection은 근본적으로 bi-temporal features의 효과적인 융합과 구별에 의존합니다. 기존 패러다임은 일반적으로 …