[Paper] 그들은 밈은 무해하다고 말했지만—우리는 해를 끼치는 밈을 찾았다: 농담, 상징, 문화적 레퍼런스 디코딩
밈 기반 사회적 학대 탐지는 해로운 의도가 종종 암묵적인 문화 상징성과 미묘한 교차 모달 불일치에 의존하기 때문에 어려운 과제이다. 이전에 …
3058 posts from this source
밈 기반 사회적 학대 탐지는 해로운 의도가 종종 암묵적인 문화 상징성과 미묘한 교차 모달 불일치에 의존하기 때문에 어려운 과제이다. 이전에 …
우리는 SymPlex를 제안한다. 이는 부분 미분 방정식(PDEs)의 분석적 기호 해를 발견하기 위한 강화 학습 프레임워크이며, 접근 없이도 가능하다.
멀티모달 대형 언어 모델(Multimodal Large Language Models, MLLMs)은 거대한 모델 크기와 시각 토큰 수와 관련된 심각한 학습 비효율성 문제를 겪고 있다.
추론 대형 언어 모델(LLMs)은 테스트 시 스케일링을 가능하게 하며, 토큰 예산이 증가함에 따라 데이터셋 수준 정확도가 향상되어 적응형 추론을 촉진합니다.
자동회귀 이미지 생성에서 주요 과제는 상호 의존성을 모델링하면서도 독립적인 위치들을 병렬적으로 효율적으로 샘플링하는 것입니다.
그래프 신경망(GNN)에서 불균형 노드 분류는 일부 라벨이 다른 라벨에 비해 훨씬 많이 나타날 때 발생하며, 이는 모델이 불공정하게 학습하도록 만든다.
최근에는 실제 과제에 강화 학습(RL)을 적용해 대형 언어 모델(LLMs)을 훈련시키는 연구에 큰 관심이 집중되고 있습니다, 예를 들어 …
현대의 distributed optimization 방법은 비동기 최적화에서 상당한 최근 진전에도 불구하고 대부분 전통적인 synchronous 접근 방식에 의존합니다. 우리는 ...
비전문가 사용자가 복잡한 인터랙티브 웹사이트를 개발하도록 돕는 것은 LLM‑powered code agents에게 인기 있는 작업이 되었습니다. 그러나 기존 code agents는 …
Prompt injection attacks는 웹 페이지 콘텐츠를 조작하여 web agents가 사용자가 의도한 작업이 아니라 공격자가 지정한 작업을 수행하도록 합니다. Existing method...
Long-context inference with Large Language Models (LLMs)는 quadratic attention과 증가하는 key-value caches 때문에 비용이 많이 들며, 이는 context compression을 필요하게 합니다. In t...
프로그래밍 언어의 개발은 복잡한 이론적 및 실용적 과제를 수반하며, 특히 modularity와 reusability를 다룰 때 …
인간 시각은 foveated 구조를 가지고 있으며, 해상도가 가변적으로 큰 시야의 중심에서 최고에 달한다; 이는 능동적 감지를 위한 효율적인 절충을 반영한다, allo...
TensorFlow와 Pytorch와 같은 Deep Learning(DL) 라이브러리는 machine learning(ML) 모델 개발을 단순화하지만 복잡한 설계 때문에 버그가 발생하기 쉽습니다. Bug...
우리는 가속 노이즈 파워 메서드(Accelerated Noisy Power Method)를 분석한다. 이 알고리즘은 주성분 분석(Principal Component Analysis)을 수행하는데, 여기서는 정확하지 않은 행렬-벡터 곱(matrix-vector products)만 이용할 수 있는 상황을 가정한다.
Equilibrium Propagation (EP)은 물리학에서 영감을 받은 학습 알고리즘으로, 동적 시스템의 정상 상태를 추론과 학습 모두에 사용합니다. 그것의 ...
AI-enabled systems는 동적 워크로드, 리소스 요구사항, 모델 드리프트 등 다양한 유형의 런타임 불확실성에 노출됩니다. 이러한 불확실성…
맥락: 코드 커버리지는 소프트웨어 품질 보증 측정으로 널리 사용됩니다. 그러나 그 효과와 특히 권장되는 양은 양쪽 모두에서 논쟁이 있습니다.
테스트 주도 개발(TDD)은 테스트를 실행 가능한 사양으로 활용하여 대형 언어 모델(LLM) 기반 코드 생성을 개선하기 위해 채택되었습니다. 그러나,…
Flaky tests는 동일한 버전의 소스 코드를 여러 번 실행할 때마다 다른 결과를 나타냅니다. 따라서 이들은 품질에 대한 모호한 신호를 제공합니다.
비동기 파이프라인 병렬성은 동기 실행에 내재된 파이프라인 버블을 제거함으로써 하드웨어 활용도를 극대화하며, e...에 대한 경로를 제공한다.
Mixture of Experts (MoE) 아키텍처는 계산량이 비례적으로 증가하지 않으면서 LLM의 용량을 크게 향상시키지만, 방대한 파라미터…
Agreement는 분산 컴퓨팅에서 기본적인 문제로, 40년 이상에 걸쳐 광범위하게 연구되어 왔습니다. 최근에 Meir, Mirault, Peleg 및 Robins…
블록체인 검증자들은 멀티코어 CPU를 활용하여 블록 처리 시간을 줄일 수 있지만, 결정적 실행은 주어진 전체 순서를 유지하면서 ...