[Paper] 이상한 일반화와 귀납적 백도어: LLM을 손상시키는 새로운 방법
LLM은 일반화가 뛰어나기 때문에 유용합니다. 하지만 좋은 것이 과하면 안 될까요? 우리는 좁은 맥락에서 소량의 finetuning이 can dra...
LLM은 일반화가 뛰어나기 때문에 유용합니다. 하지만 좋은 것이 과하면 안 될까요? 우리는 좁은 맥락에서 소량의 finetuning이 can dra...
이 논문은 lock-freedom와 recoverability를 모두 도입하는 최초의 변환을 제시한다. 우리의 변환은 lock-based 구현으로 시작한다, a...
동질적인 GPU 기반 딥러닝(DL) 훈련이 널리 사용되고 있음에도 불구하고, 스트래글러의 발생 빈도, 원인 및 영향과 기존 s...
대형 언어 모델(LLMs)은 코드 생성에서 강력한 성능을 달성하지만, 체인‑오브‑쓰레드(Chain-of-Thought, CoT) 프롬프트가 도움이 되는 메커니즘은 아직 명확하지 않다. W...
Equivariant neural networks는 대칭을 inductive bias로 인코딩하고, 다양한 분야에서 강력한 empirical performance를 달성했습니다. 그러나 그들의 expressive power는…
우리는 SynthPix, Particle Image Velocimetry (PIV)를 위한 합성 이미지 생성기를 소개한다. 이 시스템은 성능과 가속기에서의 병렬성에 중점을 두고 구현되었다.
효과적인 로그 이상 탐지는 대규모 IT 인프라의 신뢰성을 유지하는 데 필수적입니다. Transformer 기반 모델은 상당한 자원을 필요로 합니다.
시스템 엔지니어링은 문서 중심에서 모델 기반 접근 방식으로 전환하고 있으며, 자산이 점점 더 디지털화되고 있습니다. 디지털화는 …
Quantum circuit design은 복잡하고 실제 세계 데이터에 대한 실용적인 quantum machine learning에 있어 핵심 병목 현상입니다. 우리는 automated framework를 제시하여 …
Task scheduling은 클라우드 컴퓨팅에서 중요한 연구 과제이며, 산업 전반에 널리 채택된 변혁적인 기술입니다. 수많은 scheduling …
워크플로우 마이닝은 이벤트 로그에서 계층적 프로세스 트리를 발견하지만, 이러한 모델이 논리적 속성을 만족하거나 위반하는 이유가 명확하지 않으며, 혹은 개별…
웨어러블 시스템을 위한 Eye tracking은 낮은 지연 시간과 밀리와트 수준의 전력을 요구하지만, 기존의 프레임 기반 파이프라인은 모션 블러와 높은 연산량으로 어려움을 겪는다...