[Paper] 신뢰 함정: LLM에서의 성 편향과 예측 확신
민감한 분야에서 Large Language Models (LLMs)의 사용이 증가함에 따라, 그들의 confidence scores가 fairness와 bias에 어떻게 대응하는지에 대한 관심이 커지고 있다....
민감한 분야에서 Large Language Models (LLMs)의 사용이 증가함에 따라, 그들의 confidence scores가 fairness와 bias에 어떻게 대응하는지에 대한 관심이 커지고 있다....
Large language models (LLMs)은 다중 홉 추론을 수행하는 능력, 즉 여러 정보 조각을 결합하는 능력에 대해 점점 더 평가되고 있습니다…
시스템 로그는 모니터링 및 진단을 위해 현대 컴퓨팅 인프라에서 필수적이지만, 그 규모와 복잡성 때문에 신뢰할 수 있고 효율적인 자동화된 i...
대규모이며 동적인 툴 라이브러리를 활용하는 LLM agents는 효과적인 검색에 의존하지만, 표준 단일 샷 dense retrievers는 복잡한 요청을 처리하는 데 어려움을 겪는다....
Vision-Language Models (VLMs)가 Computer-Using Agents (CUAs)를 크게 발전시켰지만, 현재 프레임워크는 장기 작업 흐름에서 견고성에 어려움을 겪고 있습니다...
우리는 중환자실에서 지속적인 위험 추정을 위한 다중모달 디지털 트윈 프레임워크인 DT-ICU를 소개한다. DT-ICU는 가변 길이의 임상 시계열 데이터를 통합한다.
대형 언어 모델(LLMs)은 자신의 불확실성에 대해 놀라울 정도로 정교한 추정치를 제공할 수 있다. 그러나 이러한 표현이 어느 정도까지 유효한지는 아직 명확하지 않다.
Kolmogorov-Arnold Networks (KANs)는 복잡한 비선형 함수를 효율적으로 근사하는 데 강력한 잠재력을 보여주었습니다. 그러나 원래 KAN 공식은 …
discriminant observables를 사용하여 이벤트를 분류하는 것은 많은 high-energy physics 분석의 핵심입니다. 그러나 bin boundaries는 종종 수작업으로 선택됩니다. 간단하고, 대중적인…
Riesz representer를 추정하는 것은 인과 및 구조 파라미터 추정을 위한 디바이어스드 머신러닝에서 중심적인 문제입니다. Riesz representer에 대한 다양한 방법…
Self-supervised pre-training with contrastive learning은 sparsely labeled data로부터 학습하기 위한 강력한 방법입니다. 그러나 성능이 크게 떨어질 수 있습니다 ...
우리는 UAIT(Uncommon-sense Action Image-Text) 데이터셋을 제안한다. 이는 시각 언어 모델의 의미 이해 능력을 테스트하기 위해 설계된 새로운 평가 벤치마크이다.