[论文] 提问、回答与检测:使用角色扮演 LLMs 进行人格检测的基于问题条件的 Mixture-of-Experts
理解人类个性对于个性化推荐和心理健康评估等网络应用至关重要。现有关于个性的研究……
3337 posts from this source
理解人类个性对于个性化推荐和心理健康评估等网络应用至关重要。现有关于个性的研究……
随着基于 AI 的代码生成变得普及,研究人员正在研究代码 LLM 的校准——确保它们的置信度分数能够忠实地表示……
尽管在安全领域的machine learning取得了进展,rule-based detection仍然在Security Operations Centers中普遍存在,因为其资源密集性……
在大规模数据上预训练的基础模型已经展示了跨领域的显著零-shot 泛化能力。基于 TabPFN 的成功……
文档阴影去除对于提升数字化文档的清晰度至关重要。保留高频细节(例如文本边缘和线条)是关键……
本文探讨了在联邦学习(FL)环境中,使大型语言模型(LLMs)与多样化的人类偏好保持一致的挑战,其中...
我们提出了一种针对低资源语言的后训练方法,即使在使用不流畅的奖励模型进行对齐时,也能保持语言模型的流畅性。Preference...
近年来,高性能计算机视觉模型在医学影像领域取得了显著成功,甚至有一些皮肤病变分类系统……
自动手语识别(ASLR)已成为弥合聋人与听人社区之间鸿沟的关键领域。然而,手势的……
多重网格方法一直是求解由偏微分方程(PDE)离散化产生的线性系统的流行方法,适用于多个维度……
在本文中,我们研究了空间和时间上的云工作负载转移以降低碳、水和土地使用足迹的潜力。具体而言,我们 p...
本文介绍了首个公开可用的巴斯克语自动作文评分(AES)和反馈生成数据集,针对CEFR C1水平……
在本文中,我们介绍了 RESTifAI,这是一种由 LLM 驱动的方法,用于生成可复用、适用于 CI/CD 的 REST API 测试,遵循 happy‑path 方法。不同于 …
正确地设计和实现分布式系统可能相当具有挑战性。虽然这些系统通常伴随形式化规范,这些规范……
临床沟通是患者结果的核心,但大规模人工标注患者-提供者对话仍然劳动密集型且不一致,...
ML-Enabled Systems (MLES) 本质上是复杂的,因为它们需要多个组件来实现业务目标。此经验报告展示了……
我们介绍 QSTN,这是一款开源的 Python 框架,用于系统地从问卷式提示生成响应,以支持 in-silico 调查和 ann…
高效的 edge caching 能降低延迟并缓解现代网络中的 backhaul 拥塞。传统的缓存策略,如 Least Recently Used (LRU) ...
预测职业篮球比赛的结果,特别是美国国家篮球协会(NBA)的比赛,已变得对教练越来越重要。
传统上,多线程数据结构是为操作系统(OS)的线程访问而设计的。然而,针对程序员访问的实现……
多重网格求解器是求解泊松方程的最有效方法之一,泊松方程在计算物理中无处不在。例如,在 …
本研究调查学习者在教育环境中对游戏设计元素(GDEs)的偏好,以为目的驱动的游戏化(purpose-driven gamification)的开发提供信息。
本研究通过区分年龄和性别的不同影响,为学生对计算机科学(CS)教育的兴趣提供了新的见解。
虽然在敏捷软件开发中人因的重要性已被广泛认可,但对个人“agile agreement”的衡量仍然是一个模糊的……
机器学习(ML)模型的训练和部署已变得极其耗能。虽然现有的优化工作主要关注硬件……
生物系统表现出显著的 morphogenetic plasticity,单一基因组可以编码由局部化学…触发的各种专门的细胞结构。
现代计算架构配备了低精度矩阵乘法单元,其吞吐量远高于高精度对应单元……
用于漏洞预测(VP)的神经模型通过从大规模代码库中学习,已经取得了令人印象深刻的性能。然而,它们的易感…
行业对跨越云到边缘的超分布式应用的需求正在增长,这些应用涉及智能制造、交通等领域……
本文将在加密货币市场的背景下提出一种新颖的基于机器学习的投资组合管理方法。之前的研究者主要关注……
神经损伤和与年龄相关的衰退会损害感觉处理并扰乱运动协调、步态和平衡。作为神经可塑性(neuroplasticity)的机制……
医学决策经常使用将风险方程与规则相结合的算法,提供清晰且标准化的治疗路径。Symbolic r...
体素艺术是一种在游戏和数字媒体中广泛使用的独特风格化,但从 3D meshes 自动生成仍然具有挑战性,因为存在冲突的…
人类不仅仅看到属性相似——我们也看到关系相似。苹果像桃子,因为两者都是红色的水果,但地球也是……
大型语言模型(LLM)的分布外(OOD)泛化能力对其部署至关重要。先前的研究评估LLM的泛化……
近期的视频生成模型展示了令人印象深刻的合成能力,但仍受单模态条件的限制,限制了它们的整体工作……
视觉生成模型(例如 diffusion models)通常在压缩的潜在空间中运行,以平衡训练效率和样本质量。与此同时,...
本文首次进行大规模现场研究,探讨通用 AI 代理在 open-world web 环境中的采纳、使用强度和使用案例。
随着网络威胁的复杂性和多样性不断升级,静态honeypots已不足以应对,必须采用自适应、情报驱动的欺骗。在……
基于指令的图像编辑数据集的质量和多样性正在不断提升,然而用于基于指令的……的大规模高质量数据集仍然不足。
众包平台,例如 Stack Overflow,已经改变并影响了软件开发实践。在这些平台上,开发者分享和复用……
近期的视频生成器实现了惊人的写实效果,但在三维空间上仍然根本不一致。我们提出了 WorldReel,这是一种原生的四维视频生成器……
我们提出了一种新颖的基于图的 EEG 表征学习方法,称为梯度对齐(GEEGA),它利用多域信息来学习 EEG 表征……
为什么现代 language models 在进行 next-word prediction 训练后,似乎能够生成连贯的文档并捕捉长程结构?在这里我们展示……
用于代码的大型语言模型(LLM4Code)显著提升了开发者的生产力,但也因依赖开源仓库而引发了隐私担忧……
未来的 AI 系统可能在评估期间隐藏其能力(“sandbagging”),从而误导开发者和审计员。我们对 sandbag...进行压力测试。
量子比特读取是量子计算系统中的关键操作,它将量子比特的模拟响应映射为离散的经典状态。深度神经网络……
在3D表示中嵌入语言字段,通过将几何与描述性意义关联,实现对空间环境更丰富的语义理解。Th...