[Paper] 생성 AI 시대의 소프트웨어 엔지니어링 전문가들의 역할과 정체성 작업
Generative AI(GenAI)의 도입은 소프트웨어 엔지니어링에 큰 변화를 예고합니다. 이는 기술적인 측면뿐만 아니라 전문가들의 인간적인 측면도 포함합니다.
4528 posts from this source
Generative AI(GenAI)의 도입은 소프트웨어 엔지니어링에 큰 변화를 예고합니다. 이는 기술적인 측면뿐만 아니라 전문가들의 인간적인 측면도 포함합니다.
자동차 소프트웨어가 하드웨어 가용성을 점점 더 앞서가면서, 늦은 통합과 비용이 많이 드는 하드웨어‑인‑더‑루프(HiL) 병목 현상을 초래하고 있습니다. The InnoRegioCha...
리튬이온 배터리의 내부 상태를 정확하고 실시간으로, 그러나 비파괴적으로 추정하는 것은 열화 예측 및 사용 전략 최적화에 필수적입니다…
인공지능(AI)은 소프트웨어 개발 작업의 다양한 부분을 점점 더 자동화하고 있습니다. AI가 개발 작업의 생산성을 향상시켰음에도 불구하고...
우리는 오픈소스 메시지 지향 미들웨어(MOM) 시스템에 대한 포괄적인 특성화 연구를 제시합니다. 우리는 엄격한 방법론을 따라 선택하고 연구했습니다.
최근 멀티모달 추론의 진보로 이미지 를 해석하고 이를 언어와 연결하며 구조화된 분석 작업을 수행할 수 있는 에이전트가 가능해졌습니다. 확장...
Diffusion Language Models (DLMs)는 반복적인 디노이징으로 인해 높은 추론 비용이 발생하여 효율적인 프루닝을 필요로 합니다. 기존 프루닝 휴리스틱은 주로 …
Vision-Language-Action models (VLAs)는 언어 지시를 로봇 제어에 연결할 것을 약속하지만, 실제로는 언어를 충실히 따르지 못하는 경우가 많다. When pr...
보상 모델링은 RLHF와 RLAIF를 포함한 현대 정렬 파이프라인의 핵심 요소이며, PPO와 TRPO를 포함한 정책 최적화 방법의 기반을 제공합니다. How...
언어 식별(LID)은 다국어 자연어 처리 파이프라인에서 중요한 구성 요소이며, 코퍼스 큐레이션 및 훈련을 용이하게 합니다…
인간이 고위험 의사결정을 위해 다중 라운드 대화형 AI에 점점 더 의존함에 따라, 이러한 상호작용이 신뢰할 수 있게 구현되도록 원칙적인 프레임워크가 필요합니다.
대규모 비전-언어 모델(LVLMs)에 대한 블랙박스 적대적 공격은 그래디언트가 없고 복잡한 멀티모달 경계 때문에 어려운 과제입니다. 기존 연구는…
복잡한 장면에서 사용자가 지정한 객체를 검색하는 것은 특히 쿼리가 모호하거나 유사한 객체가 여러 개 포함될 때 어려운 과제입니다. Exi...
시계열 파운데이션 모델을 학습하는 것이 다양한 시계열 도메인에서 제로샷 시계열 예측에 유망한 접근법임이 입증되었습니다. Insof...
LLM을 활용한 추론은 점점 더 넓은 검증 루프 안에서 전개됩니다. 내부적으로 시스템은 자기 일관성(self-consistency)이나 프록시 보상(proxy rewards)과 같은 저비용 검사를 사용합니다, …
현대의 오프라인 Reinforcement Learning (RL) 방법은 성능이 좋은 actor-critic을 찾지만, 이러한 actor-critic을 온라인에서 value-based RL 알고리즘으로 미세 조정하는…
신흥 페르시아어 NLP 벤치마크가 화용론과 공손함으로 확장되고 있지만, 이들은 기억된 문화적 사실과 능력을 구분하는 경우는 드물다.
LLM 기반 에이전트는 침투 테스트 자동화에 대한 가능성을 보여주지만, 보고된 성능은 시스템 및 벤치마크마다 크게 차이납니다. 우리는 28개의 LLM 기반 …
강화 학습(RL)은 추론 작업에서 대형 언어 모델을 개선하는 데 널리 사용되며, 비동기 RL 훈련은 ...
대규모 언어 모델(LLMs)의 확산은 기계가 생성한 콘텐츠와 인간이 작성한 텍스트를 구별할 효율적인 메커니즘을 필요로 합니다. 통계적 ...
현재 speech LLM은 대체로 암시적 ASR을 수행한다: 전사본으로 해결 가능한 작업에서는 행동적으로 그리고 메커니즘적으로 단순 WhispertoL과 동등하다.
자율 웹 에이전트가 급속히 발전하고 있음에도 불구하고, 인간의 개입은 작업이 진행됨에 따라 선호도를 형성하고 에이전트 행동을 교정하는 데 여전히 필수적이다. Howe...
최근 멀티모달 대형 언어 모델(MLLMs)의 발전은 전문 도구 기반 이미지에 대한 비전‑언어 추론을 확장할 큰 잠재력을 보여주고 있습니다.
Error-bounded lossy compression은 대규모 HPC 시뮬레이션에서 생성되는 방대한 데이터 양을 관리하는 데 필수적입니다. 최신 압축기들은 …
이 논문은 극히 긴 시간 범위 작업을 해결하도록 훈련된 오픈소스 LLM 에이전트인 KLong을 소개한다. 원리는 먼저 트래젝토리를 통해 모델을 콜드스타트하는 것이다.
Instruction‑following language models는 도움이 되고 안전하도록 훈련되지만, 그들의 안전 행동은 온건한 fine‑tuning 하에서는 악화될 수 있고, ad… 아래에서 더욱 악화될 수 있다.
우리는 익명 n-노드 네트워크에서 self-stabilizing leader election 문제를 연구한다. 낮은 공간 메모리 복잡도로 self-stabilization을 달성하는 것은 특히…
Natural Language Processing (NLP) 도구는 요구사항 공학(RE) 작업인 요구사항 도출, 분류 및 검증을 지원합니다. 그러나, 그들은…
Self-adaptive systems는 인간과 점점 더 긴밀하게 상호작용하며, 종종 동일한 physical 또는 virtual 환경을 공유하고 의사결정을 e...
Quantum computing은 고전 컴퓨터의 능력을 뛰어넘는 계산 문제를 해결할 잠재력 때문에 큰 관심을 받고 있습니다. With maj...
데이터 소스에 가까운 곳에서 감각 데이터를 처리하는 것은 종종 Edge 디바이스를 포함하며, 스마트 시티와 같은 광범위한 애플리케이션에 낮은 latency를 제공한다. 이는 일반적으로…
AllReduce는 분산 컴퓨팅에서 기본적인 집합 연산이며 대규모 학습 및 추론에 있어 핵심 성능 병목 현상입니다. 그 완료…
1990년대 초 도입된 이후, 웹은 전 세계에서 가장 큰 애플리케이션 플랫폼이 되었습니다. HyperText Markup Language (HTML)은 ...
대규모 언어 모델(LLM)은 점점 더 긴 코드 컨텍스트에 대한 추론이 필요한 소프트웨어 엔지니어링 작업을 지원하고 있지만, 다양한 입력에 따라 그 견고성은 아직 충분히 검증되지 않았다.
소프트웨어 역사를 통틀어, 진화는 경쟁에 의해 촉진되는 흥망성쇠의 주기로 일어났으며, 오픈소스 소프트웨어(OSS)도 예외는 아니다. Thi...
피드백이 task structure보다 더 빨리 흡수될 때, 학습자는 진실보다 피드백을 선호하게 된다. 두 시간 척도(two‑timescale) 모델은 이러한 feedback‑truth 관계를 보여준다.
Implicit Neural Representations (INRs)는 최근 비디오 압축에서 인상적인 성능을 보여주었습니다. 그러나 별도의 INR을 개별적으로 과적합해야 하기 때문에…
Latent space models은 고차원 이산 데이터 매트릭스, 예를 들어 전자 건강 기록(EHRs)의 patient-feature 매트릭스 등을 분석하는 데 널리 사용됩니다.
LLM 기반 에이전트는 복잡한 권한 정책이 필요한 상황에서 점점 더 많이 배치되고 있습니다: 고객 서비스 프로토콜, 승인 워크플로우, 데이터 액세스...
야생 환경에서 인간형 로봇을 사용한 임의 물체에 대한 Visual loco-manipulation은 정확한 end-effector (EE) 제어와 일반화 가능한 이해를 필요로 한다.
Fast weight architectures는 장기 컨텍스트 모델링을 위해 일정한 메모리 오버헤드를 유지하면서 attention‑based transformers에 대한 유망한 대안을 제공합니다.
대형 언어 모델(LLMs)은 생물학 벤치마크에서 강력한 성능을 보이며, 초보자들이 이중용도 실험실 기술을 습득하는 데 도움을 줄 수 있다는 우려를 불러일으키고 있습니다. Ye...
Vision-language models (VLMs)는 시각 및 텍스트 모달리티를 공동으로 활용하여 추론하는 것을 목표로 합니다. 추가적인 inference-time computation을 할당하는 것이 ...
Machine unlearning은 훈련된 모델에서 특정 데이터 포인트를 제거하는 것을 목표로 하며, 종종 ‘perfect retraining’을 모방하려고 합니다. 즉, …
Single-cell RNA sequencing (scRNA-seq) 데이터는 강력하고 재현 가능한 통계적 구조를 보여준다. 이는 대규모 foundation 모델 개발을 촉진하였다.
다중 가설 검정과 거짓 발견율(FDR) 제어는 통계적 추론에서 기본적인 문제이며, 유전체학, 약물 분야 등에 널리 적용됩니다.
본 연구에서는 공정 k‑center 문제의 근사 난이도를 연구한다. 여기서 데이터 포인트는 그룹으로 분할되며, 과제는 …
현재 audio language models는 대부분 text-first이며, 사전 학습된 pre-trained text LLM backbones를 확장하거나 semantic-only audio tokens에 의존하여, g...를 제한한다.