网络效应与大型语言模型辩论中的协议漂移

张开发
2026/5/26 15:23:17 15 分钟阅读
网络效应与大型语言模型辩论中的协议漂移
摘要大语言模型展现出前所未有的模拟类人社会行为的能力使其成为模拟复杂社会系统的有效工具。然而这些模拟在多大程度上能够可靠地捕捉关键的社会机制尤其是在涉及少数群体的高度不平衡情境下目前尚不明确。本文采用具有可控同质性和类别规模的网络生成模型研究大语言模型智能体在多轮辩论中的集体行为。我们发现大语言模型智能体表现出的收敛与极化模式对网络结构和相对群体规模高度敏感。此外我们的发现揭示了一种特定的方向性倾向我们称之为“共识漂移”即智能体更倾向于向意见尺度上的特定位置移动。总体而言我们的发现强调在将大语言模型群体视为人类群体的行为代理之前有必要将结构效应与模型固有偏见区分开来。关键词大语言模型 意见动力学 同质性 社会模拟引言大语言模型的引入彻底改变了自然语言处理领域提升了语言模型解决文本相关任务和生成高度类人文本的能力。这些模型在广泛的自然语言处理任务中展现出卓越的能力标志着通用人工智能模型开发的转型以及向通用人工智能迈进的进展。除了技术能力之外大语言模型还展现出前所未有的模拟人类社会行为的能力。在正确提示下大语言模型能够模仿具有特定人口统计学和心理特征的用户角色、职业、政治立场以及一般的人类行为使其成为研究其在复杂模拟社会中潜在行为的有力工具。随着这些模型在各种应用中的日益普及理解它们的集体行为变得至关重要。一个关键问题是大语言模型是否能够自发地展现出作为其训练过程中涌现特性的类人社会行为而非通过显式的行为编程实现。例如大语言模型已经展现出模拟心理理论的能力这可能使主观行为建模和对模糊自然语言指令的理解成为可能。对此存在大量争论研究提供了相互矛盾的证据。然而即使是模拟的心理理论也可能帮助大语言模型与其他智能体进行更自然的互动。这些集体行为虽然有助于更好地理解大语言模型和人类行为但可能会将先前未知的偏见引入决策过程或加剧训练数据中嵌入的社会偏见对人类与大语言模型的互动产生潜在未知的影响。尽管大量文献聚焦于定义非结构化的智能体互动例如关于气候变化或转基因食品等争议性话题的讨论但对更结构化的智能体群体的研究关注较少。当我们与他人互动时会形成社会联系这些联系可以建模为图中的边个体作为节点。人类社会建立在不成文的社会规则之上例如同质性即“物以类聚人以群分”。人们倾向于被那些被认为与自己相似的人所吸引从而加强彼此之间的联系同时回避那些被认为差异过大的人。这种行为会产生各种后果它可能放大社会分裂强化群体之间的界限并最终导致人口分化为同质化的集群。为什么这些问题如此重要至少有两个原因使得这些问题需要被解决。通过观察大语言模型智能体如何响应同质性和类别不平衡等拓扑因素可以刻画其集体行为中涌现的潜在倾向。理解这些动态对于在高风险或决策关键的情境中可靠地解释其输出至关重要。其次由于大语言模型越来越多地被用于基于智能体的人类社会系统模拟评估其互动在多大程度上能够准确反映真实的人类行为至关重要。许多近期的研究将大语言模型定位为人类行为的代理尤其是在心理学等语言至关重要的领域。然而这种使用方式假设了一定程度的行为真实性而这种真实性在更严格的审视下可能并不成立。如果大语言模型群体系统性地偏离已知的人类意见形成模式——例如收敛过快、压制分歧、或对群体规模表现出过度的敏感性——这就对其作为模拟人类集体行为工具的有效性提出了质疑。因此理解大语言模型在何时以及如何接近或偏离类人动态对于方法论的有效性和伦理使用都至关重要。

更多文章