在历史长河中求索:探寻“搜索”的嬗变与未来「NotDeepReport」
- 本文内容使用Google的Deep Research生成
一、 恒久之问:跨时代解构“搜索”
本章旨在奠定对“搜索”一词的基础理解,追溯其语言学根源,并探讨驱动人类探求信息行为的根本动机。其目的在于为理解“搜索”概念本身如何演变——即便其背后需求相对恒定——搭建舞台。
A. 从日常动词到数字指令:“搜索”的语义流转与意义变迁
“搜索”一词的词源可追溯至中古英语“cerchen”及盎格鲁-法语“cercher”,最终源自晚期拉丁语“circare”(意为四处走动、漫游、遍寻)和拉丁语“circus”(圆圈)¹。这一词源本义“四处探寻”或“彻底调查”,自其在14世纪(动词)和15世纪(名词)诞生之初,便凸显了该词所固有的主动、探索性特质¹。
在互联网出现之前,“搜索”主要指代一种物理行为,即寻找有形之物、查阅记录或调查场所¹。例如,在林中搜寻失踪的孩童、在书桌上寻找信件²,或是搜查嫌疑人是否携带武器²。正如用户在其疑问中所指出的,它曾是一个“非常普通的词汇”,是获取知识诸多步骤中的一个环节。其词根“circare”(四处走动)也巧妙地预示了信息搜寻行为的迭代和往往非线性的本质,无论这种搜寻是物理的还是数字的。早期的物理搜索涉及对区域的遍历,而现代数字搜索则常常包含多次查询、优化关键词和浏览各种结果——这正是一种数字化的“四处探寻”,揭示了人类在面对未知时一种根深蒂固的行为模式。
互联网,特别是搜索引擎的出现,极大地扩展了“搜索”的含义,使其囊括了电子化获取数字信息的行为¹。“搜索互联网”或使用“搜索引擎”成为信息搜寻的主要的、近乎本能的动作²。这一转变将“搜索”提升为数字时代的核心概念,从仅仅一个步骤转变为主要的手段。互联网并未创造“搜索”的需求,但它彻底改变了与这一行为相关的施动性和即时性,将“搜索”从一项费力的步骤转变为通往知识的感知上的直接门户。人类始终在进行搜索,是互联网提供的工具(搜索引擎)使得这一过程显得毫不费力且无所不包。这种在感知努力和范围上的转变,提升了“搜索”一词的概念地位。
“搜索”的意义也随时代而变。在前互联网时代,搜索的成功往往受限于物理可及性和物理信息的组织方式。而在互联网时代,“搜索”则成为几乎即时访问全球海量信息库的同义词,从根本上改变了人们对知识获取的期望和行为。然而,“搜索”在互联网时代的语义膨胀,可能在无形中将我们对“知识获取”的理解主要窄化为“通过搜索引擎进行信息检索”,从而可能贬低了其他获取知识的方法,如深度阅读、批判性分析或经验学习的价值。
B. 看不见的引擎:驱动知识探索的根本人类需求
信息搜寻行为是人类满足需求、解决问题或达成目标的核心活动⁴。它是一个改变个体知识状态的过程⁵。
多个心理学模型试图解释信息搜寻行为。库尔索的ISP模型(Information Search Process Model) 阐释了在信息搜寻过程中个体经历的情感和认知阶段(起始、选择、探索、形成、收集、呈现)⁴。这些阶段与“搜索”行为息息相关——个体的搜索查询和策略会随着其在这些阶段中的进展而演变。德尔文的意义建构理论(Sense-Making Theory) 认为,人们寻求信息是为了弥合理解上的“鸿沟”⁴。“搜索”即是填补这些认知空白的主动尝试。威尔逊模型(Wilson's Model) 则提供了一个整体视角,考量了影响信息搜寻的内部(心理)和外部(情境)因素,并将“信息需求”视为触发点⁴。
个体的先验知识、认知能力(如记忆、推理)、动机(从好奇到必需)以及情绪(如焦虑、沮丧)都会影响搜索行为和效果⁴。例如,眼动研究表明,认知负荷增加会导致在搜索任务中更频繁的视觉更新(更短的扫视时间)⁶。
托尼·罗宾斯提出的六种人类基本需求框架,为理解搜索背后更深层次的心理驱动力提供了有力的视角⁸:
- 确定性 (Certainty): 搜索事实、可靠信息和答案以减少模糊性(例如,查天气、看产品评论)。
- 不确定性/多样性 (Variety/Uncertainty): 搜索新奇事物、新思想、娱乐或探索未知领域。
- 重要性 (Significance): 搜索以获取专业知识、验证观点或寻找可分享的信息,从而提升自身重要感。
- 爱与连接 (Love/Connection): 搜索信息以建立关系、理解他人或与社群连接。
- 成长 (Growth): 主动搜索知识和技能以促进个人或职业发展。
- 贡献 (Contribution): 搜索信息以帮助他人、解决社会问题或为某项事业做出贡献。
驱动搜索的“根本需求”并非单一,而是认知、情感和生存驱动力的复杂互动。特定需求(例如,确定性对比成长)将塑造搜索的性质和强度。库尔索模型揭示了情感的转变,德尔文理论指向意义的建构,威尔逊模型包含了情境因素,而罗宾斯的框架则提供了一幅动机地图。它们共同描绘出搜索作为对多样化人类状态的多方面回应。例如,寻求医疗诊断的搜索(由确定性需求和恐惧驱动)与寻找新爱好的搜索(由多样性和成长需求驱动)将截然不同。
信息检索系统(包括未来的AI)的设计和功能若能与这些潜在的心理过程和需求相契合,则最为有效。如果搜索工具忽略了情感历程(如库尔索模型所示)或意义建构的需求(如德尔文理论所示),可能会导致用户沮丧或信息获取效率低下。能够适应不同动机驱动因素的AI系统(例如,为确定性需求提供简洁事实,或为成长需求提供探索路径)可能会更加成功。
随着AI承担更多直接的“回答”功能,人类在信息搜寻中的角色可能会更多地转向定义恰当的问题,并在这些根本需求的背景下解读AI生成的信息。“搜索”或许会更多地关乎在AI的输出中寻找意义和关联性。
二、 历史的回响:数字黎明前的信息求索
本节将探讨在互联网出现之前,人类如何搜寻和管理信息,重点介绍这些早期系统的独创性和局限性。这直接回应了用户对“前互联网时代”和“印刷术发明之前”信息获取方式的兴趣。
A. 匮乏时代的知识:口述传统、记忆与前印刷时代的知识获取
在文字普及和印刷术发明之前,口述传统是知识保存和传播的主要方式¹⁰。故事、神话、传说和实用知识通过口耳相传代代延续¹⁰。尽管可能出现变异,但结构化的讲述方式维持了其可靠性¹⁰。这便是最初的“搜索”——寻找有知识的个体。
在那个时代,记忆是人类知识的主要储存库¹²。学者们发展出如“记忆宫殿”之类的助记技巧,以记住海量信息¹²。获取知识往往意味着找到某个“记得”它的人。早期书写文本的稀缺和珍贵,使得知识难以“固定”或轻易复制¹²。正如用户疑问中指出的,只有少数人(例如掌管藏经阁或寺院图书馆的人)才能接触到大量资料。
印刷术发明前,文本通过手工抄写传播,这是一个缓慢、易错且常由教会等机构控制的过程¹³。这限制了传播范围,并可能导致文本随时间推移而“走样”¹³。因此,“搜索”一个准确的文本往往意味着寻找最古老、最可靠的手稿¹²。
在信息匮乏的时代,“搜索”通常是一段物理旅程或对个体的探寻,而不仅仅是寻找静态的物件。知识的权威性寓于人类的记忆和传统之中。学者们在不同的抄写室之间穿梭¹²,故事讲述者扮演着重要角色¹⁰,这表明“搜索”与社会互动和学徒制度紧密相连,而非仅仅是独自查阅文本。
对“古代文本的找回”的高度重视¹² 暗示了一种循环而非纯粹线性的知识进步观,其中再发现与新创造同等重要。努力寻找“原始、未经篡改的知识来源”¹² 与现代对“最新”信息的强调形成对比。这反映了一种不同的认识论框架,其中古代智慧拥有至高无上的权威。其原因是信息难以准确保存,其结果则是对古老来源的尊崇。从基于记忆的知识到外部化的、基于文本的知识的转变(由印刷术加速),从根本上改变了人类认知和学习的社会结构,为理解AI可能带来的更为激进的认知转变奠定了基础。
B. 井然有序的世界:图书馆、档案馆与系统化信息检索的起源
最早的图书馆是美索不达米亚(苏美尔、埃布拉、尼尼微——亚述巴尼拔图书馆)的泥板档案和埃及的纸莎草记录,主要用于商业交易、库存和行政记录¹⁴。这些标志着“历史的开端”¹⁵。早期的组织和编目方法包括将泥板存放在容器、架子上,并使用书名、序列名写在边缘的“版权信息”(colophons)进行编目¹⁵。这代表了使储存信息变得“可搜索”的最早系统性尝试。
图书馆的演变历经波斯图书馆(行政和科学记录)¹⁵、古希腊个人图书馆(公元前5世纪)¹⁵ 和罗马公共图书馆¹⁵。其功能从单纯的记录保存扩展到更广泛的知识收集和获取。在后来的前互联网时代图书馆中,图书管理员是至关重要的中介,协助用户¹⁵。实体卡片目录或印刷书籍目录,通过杜威十进制分类法或美国国会图书馆分类法等系统进行组织,是主要的“搜索”工具¹⁵。用户按作者、书名和主题进行搜索。对于期刊,则使用印刷版索引和文摘¹⁵。百科全书和词典则作为通用参考资料¹⁵。
然而,前互联网时代图书馆的“搜索”存在诸多局限¹⁵:
- 地理限制:信息获取局限于实体馆藏。
- 耗时:手动搜索速度缓慢。
- 搜索能力有限:主题词可能过于宽泛;无法进行全文搜索。
- 信息静态:目录和书籍会过时。
- 依赖馆藏:可获取的资料受限于图书馆的收藏。
图书馆中系统化组织(编目、分类)的发展,是数字搜索一个至关重要的前身。它代表了首次大规模地尝试对信息施加秩序以方便检索。泥板上的版权信息¹⁵ 和后来的卡片目录¹⁵ 都是为方便“搜索”而创建元数据的尝试。这展示了一条持续的智力脉络:要找到某物,首先需要一个系统来描述和定位它。这一原则支撑着今天的搜索引擎索引。
在数字时代之前,图书管理员扮演着“人类搜索引擎”和“相关性排序器”的角色,凸显了在驾驭复杂信息时对专家中介的持续需求¹⁵。这一人工元素执行了后来算法试图复制的任务(理解用户需求、导航复杂系统、评估来源)。图书管理员的局限性(可用性、个人专业知识)也催生了对自动化系统的渴望。从物理的、人工策划的系统到数字的、算法驱动的系统的转变,代表了信息检索中权威和信任建立方式的根本性转变。算法的感知客观性取代(或增强)了人类策划者的感知专业性。
下表总结了“搜索”在不同时代的概念、方法和意义的演变:
表1:“搜索”的演变——跨时代的概念、方法与意义
时代 | 主导“搜索”模式/工具 | “搜索”活动性质 | 时代中“搜索”的核心价值/意义 | 主要局限性/挑战 |
---|---|---|---|---|
前印刷时代(口述/记忆) | 人类记忆/说书人 | 寻求有知识的个体 | 传统的保存 | 回忆不完美/传播范围有限 |
早期印刷与手稿时代 | 抄写员/早期目录 | 为获取文本而进行的物理旅程 | 获取稀缺的原始资料 | 抄写错误/物理损毁 |
前互联网时代(图书馆/实体目录) | 卡片目录/图书管理员 | 按主题/作者手动查找 | 从馆藏中系统化检索 | 地理限制/耗时 |
早期互联网时代(目录/FTP搜索) | Archie/Gopher/Yahoo | 文件名/目录浏览 | 在新兴网络上发现信息 | 可扩展性不足/相关性基本 |
算法搜索引擎主导时代 | Google/关键词搜索 | 关键词查询/链接导航 | 全面信息检索 | 信息过载/算法偏见 |
新兴AI时代 | LLMs/对话式AI/RAG | 提示/对话/综合答案 | 直接答案生成/个性化辅助 | “幻觉”/不透明性/经济冲击 |
三、 互联网的革命:搜索引擎作为知识的仲裁者
本节将描绘互联网搜索的崛起,从早期的目录到复杂的算法引擎,并分析它们对信息获取的深远影响,回应用户对“互联网时代”以及搜索如何成为“核心手段”的关注。
A. 从人工列表到算法赋能:互联网搜索的崛起(目录、早期引擎、谷歌的影响)
在万维网出现之前和早期互联网时代,信息搜索工具相对原始。Archie (1990年) 通过文件名索引FTP档案,被认为是第一个互联网搜索引擎¹⁸。Gopher (1991年) 则在分层系统中索引纯文本文档,而Veronica和Jughead则用于搜索Gopher索引¹⁸。WAIS(广域信息服务器) 允许通过Telnet进行全文文档搜索²⁰。
随着万维网的兴起,网站目录应运而生。其中最具代表性的是Yahoo! (1994年),最初名为“杰瑞和戴维的万维网指南”,是一个人工策划的、分层组织的网站目录²⁰。它为早期网络用户提供了一种有组织的浏览和发现网站的方式,成为当时主要的网络门户之一²⁰。然而,其局限性在于人工策划无法跟上网络指数级增长的速度;人工筛选既是其优势也是其劣势²⁰。
随后出现了第一批基于爬虫的搜索引擎。Wandex (1993年) 是第一个网络爬虫(World Wide Web Wanderer)¹⁸。Aliweb (1993年) 则依赖用户提交页面¹⁸。WebCrawler (1994年) 是第一个“全文”基于爬虫的引擎,允许搜索任何页面上的任何词语,并因此广为人知¹⁸。Lycos (1994年) 以其庞大的索引量著称(到1996年已达6000万页)¹⁸。AltaVista、Excite、Infoseek 等在90年代中期出现,使用了更复杂的算法和关键词相关性技术¹⁸。
谷歌的革命(90年代末) 彻底改变了搜索领域。其PageRank算法(由拉里·佩奇和谢尔盖·布林开发)通过评估指向网页的链接质量和数量(即权威性)来对网页进行排名,这是一项革命性的创新¹⁶。这使得搜索从简单的关键词匹配/频率统计转向了对相关性和重要性的更复杂衡量。凭借卓越的相关性,谷歌迅速占据了主导地位¹⁶。搜索算法也从简单的关键词匹配演变为综合考量内容、结构、链接、移动端优化、本地搜索和用户行为的复杂系统²³。
从目录到基于爬虫的搜索引擎的演变,是由迅速扩张的网络所带来的可扩展性危机驱动的。人工策划无法跟上步伐,因此需要自动化的解决方案。Yahoo!的模型²¹ 对于规模较小的网络是有效的。但随着网站数量的爆炸式增长(这是一个隐含的背景),劳动密集型的人工分类²⁰ 成为瓶颈。像WebCrawler和Lycos这样的基于爬虫的引擎¹⁸ 提供了一种自动索引海量内容的方法,从而满足了用户日益增长的更广泛发现需求。
搜索引擎面临的核心挑战迅速转变为“相关性”。仅仅找到关键词是不够的;有意义地对结果进行排序才是关键的区别因素,这催生了像PageRank这样的创新。早期引擎专注于关键词匹配²³,这导致了诸如关键词堆砌²³ 和大量通常不相关的结果²⁸ 等问题。谷歌的PageRank¹⁶ 通过引入权威性和质量的代理指标解决了这个问题,从根本上改善了用户体验,从而取得了主导地位。这表明了相关性问题与复杂排序算法解决方案之间的直接因果关系。算法搜索引擎的兴起集中了信息接入点,创造了像谷歌这样强大的“守门人”,深刻影响着哪些信息可见以及被认为重要。这为关于算法偏见、过滤气泡以及这些平台力量的讨论埋下了伏因。
B. 民主化及其隐忧:中心化搜索的双重影响
搜索引擎使得任何拥有互联网连接的人都能获取海量信息,打破了地理和体制障碍,赋予了用户自主查找信息的权力¹⁸。信息检索变得显著加快和高效,用户可以发现更广泛的视角和资源¹⁸。门户网站等依赖人工编排目录和手动导航的旧式信息获取方式效率低下,逐渐被搜索引擎边缘化或被迫整合搜索引擎技术²⁴。搜索引擎在速度、广度和(最终的)相关性上展现出巨大优势²⁸。
搜索引擎排名的重要性催生了搜索引擎优化(SEO)技术的发展。最初,这涉及简单的关键词优化,但也导致了如关键词堆砌等“黑帽”策略的出现²³。这反映了一种新的“为可见性而搜索”的现象。
然而,这种民主化也带来了新的问题和“隐忧”:
- 信息过载: 搜索引擎在提供便利的同时,也可能返回数量惊人的结果,需要用户自行筛选²⁴。
- 质量与可信度: 网络出版的便捷性意味着通过搜索找到的信息并非都准确可靠,评估的责任转移到了用户身上³⁰。
- 算法偏见与过滤气泡: 算法在追求相关性的同时,可能无意中造成结果的偏见,或将用户隔离在“过滤气泡”中(这是中心化控制引发的潜在担忧)。
- 早期互联网的“狂野西部”²⁷: 早期互联网和搜索缺乏监管,导致了潜在的滥用(例如,误导性的域名)。
通过搜索引擎实现的信息获取“民主化”,同时也创造了一种对提供这种接入的算法和平台的新的依赖形式。尽管用户获得了独立查找信息的权力¹⁸,但他们通往信息的窗口在很大程度上由少数占主导地位的搜索引擎控制。 “搜索”行为本身就受到了这些平台排名决策的中介。这是一个直接的因果关系:算法中介(原因)导致了用户依赖和平台权力(结果)。
内容创作者(通过SEO)和搜索引擎(通过算法更新)之间的博弈成为互联网时代一个决定性的动态,反映了可发现性与真实信息价值之间的张力。搜索引擎旨在提供相关结果²³。内容创作者则力求排名靠前²³。这导致了一场“军备竞赛”,SEO策略²³ 试图操纵系统,而搜索引擎则不断更新算法以反制操纵并提高质量。这场持续的冲突塑造了网络的内容格局。搜索的中心化虽然高效,却将巨大权力集中在少数公司手中,不仅影响信息获取,还影响在线商业、媒体和话语。当我们进入AI时代,类似的权力动态可能会出现,这种集中化是一个关键的考量因素。
四、 AI的转折点:搜索的重构、重新定义或边缘化?
本节将探讨用户对未来展望的核心关切:人工智能(AI)如何改变搜索的范式,其削弱当前搜索模型价值的潜力,以及它带来的新挑战。
A. 超越关键词:AI对信息检索范式的变革
人工智能正在将搜索从关键词匹配转向对自然语言、用户意图和上下文的理解。传统的SEO正在演变为AI SEO或AEO(AI引擎优化)²⁶。
- 大型语言模型(LLMs)和生成式AI(如ChatGPT、Gemini、Claude等)能够生成类似人类的文本,理解复杂查询,并提供直接的、综合性的答案,而不仅仅是链接列表³³。这挑战了点击多个链接的传统搜索模式³⁶。
- 检索增强生成(RAG) 通过从外部知识库(包括实时互联网)检索相关、最新的信息来增强LLM,然后再生成响应³³。这解决了LLM静态知识的局限性。谷歌的AI Overviews便利用了RAG技术³⁷。RAG旨在提供更准确、上下文更丰富且有证据支持的答案,并经常引用来源³⁷。
- 多模态AI(MLLMs) 能够同时处理和整合来自多种模态(文本、图像、音频、视频)的信息⁴²。这使得交互更直观(例如,对图像提问,用图像搜索),并能更全面地理解内容和用户意图⁴³。
- 对话式AI 通过自然语言对话实现信息搜寻,涉及顺序交互和上下文维护⁴⁵。其应用包括对话式搜索、问答和推荐⁴⁵。提示工程(Prompt engineering)成为一项新技能⁴⁶。
- 知识图谱(KGs) 将知识表示为实体和关系,为LLM提供结构化数据以更好地理解和推理³⁷。图RAG(Graph RAG)使用KG指导检索,确保生成的响应基于结构化知识³⁷。
AI不仅仅是在改进现有搜索,而是在从根本上改变信息交互的范式,从“文档检索”转变为“答案生成”和“基于对话的探索”。关键词曾导向链接列表(传统搜索)。而AI,特别是带有RAG的LLM³³,旨在从这些链接(及其他来源)中综合信息,形成直接答案。对话式AI⁴⁵ 将搜索转变为互动对话。MLLM⁴³ 则允许超越文本的输入和输出。这是一种质的飞跃,而不仅仅是量的提升。
这些AI技术(LLM、RAG、KG、MLLM)的整合,预示着向更整体化、更具上下文感知能力的信息系统的迈进,这些系统更接近于模拟人类的理解方式。KG提供对实体和关系的结构化理解⁵⁰。MLLM像人类一样通过多种感官处理信息⁴³。RAG试图将生成内容锚定在事实数据上³⁷。其目标似乎是创造一种不仅能匹配模式,还能以更接近人类的方式“理解”和“谈论”信息的AI。这种转变要求用户具备新的素养(例如,提示工程⁴⁶,对AI生成答案的批判性评估),也要求内容创作者采用新的优化策略(超越传统SEO³²)。“成功搜索”的定义本身正在发生改变。
下表总结了重塑信息获取和“搜索”的AI技术:
表2:重塑信息获取和“搜索”的AI技术
AI技术/范式 | 信息环境下的核心功能 | 对传统“搜索”范式的影响 | 强调/引入的潜在新“核心概念” | 主要机遇与挑战 |
---|---|---|---|---|
大型语言模型 (LLMs) 与生成式AI | 理解自然语言,生成类人文本,综合信息 | 从链接列表转向直接答案,减少多次点击需求 | 答案生成 (Answer Generation) | 机遇:速度、便利性;挑战:“幻觉”、来源不透明 |
检索增强生成 (RAG) | 将LLM响应锚定在外部、当前数据中 | 解决LLM知识截止问题,提升答案准确性/时效性 | 动态锚定 (Dynamic Grounding) | 机遇:事实准确性;挑战:检索复杂性 |
多模态大型语言模型 (MLLMs) | 处理并整合文本、图像、音频、视频数据 | 实现非文本输入搜索,更丰富的上下文理解 | 多模态理解 (Multimodal Understanding) | 机遇:直观交互;挑战:数据处理需求 |
对话式AI与智能助手 | 实现基于对话的交互,上下文追踪 | 从关键词查询转向自然对话 | 互动对话 (Interactive Dialogue) | 机遇:用户友好性;挑战:保持连贯性 |
知识图谱 (KGs) 与图RAG | 表示结构化知识,增强推理能力 | 为相关性提供更深层次的语义理解 | 语义推理 (Semantic Reasoning) | 机遇:提升相关性;挑战:知识图谱完整性 |
AI原生系统 (AI-Native Systems) | 将AI深度嵌入设备/系统架构 | 使搜索成为一种环境化、集成化的能力 | 普适智能 (Pervasive Intelligence) | 机遇:无缝集成;挑战:系统复杂性、数据隐私 |
B. 新的神谕?AI、信息真实性与“黑箱”困境
AI聊天机器人生成的响应虽然在语法上可能无懈可击,但内容上可能存在事实错误(即“幻觉”)³³。AI应用的快速普及可能超越人类核查的速度,从而加剧不准确信息在数字资源中扩散的风险³³。过度依赖AI获取答案而缺乏批判性评估,可能滋生“智力惰性”³³。
AI聊天机器人通常将信息整合为单一响应,使得用户难以了解原始来源、信息优先级排序方式或决策者³⁶。这种透明度的缺乏与传统搜索引擎形成对比,后者尽管算法不透明,但至少提供了多个链接供用户比较³⁶。这种由AI驱动的答案所具有的“黑箱”特性,将权力集中在少数AI平台提供商手中,可能形成一种“搜索的极权主义”,即由一个权威提供一个答案,而这一过程由我们看不见的算法控制³⁶。
此外,将AI生成的内容纳入未来的训练数据集,可能导致生成响应的原创性和多样性被稀释,因为模型会循环使用自身的解释,而非从多样化的、人类生成的真实来源中汲取信息³³。针对此,谷歌的立场是,单独使用生成式AI并不能决定页面质量;内容必须有益、可靠且以人为本。然而,滥用AI制作低质量内容会受到惩罚⁵¹。
AI生成直接答案的便利性,是以牺牲透明度和潜在的批判性评估为代价的,这以复杂的方式转移了验证的责任。AI提供了快速、综合的答案³⁶,这非常方便。然而,这一过程往往不透明³⁶,且答案可能出错³³。用户可能会因为这些答案具有说服力且连贯的特性而盲目信任它们³³,从而减少了对原始来源的批判性参与。
AI的“黑箱”特性不仅是一个技术问题,更是一个认识论问题,它从根本上改变了社会中知识的构建、验证和信任方式。如果AI答案背后的来源和推理过程未知³⁶,我们如何评估其有效性?这挑战了传统的证据和权威观念。“权威”从可识别的作者/来源转向了AI模型本身,而AI模型通常由企业控制。AI生成内容和答案的泛滥,可能导致一场“认知危机”,使得区分真实的人类知识与合成的、可能存在缺陷的信息变得越来越困难,从而影响公共话语、教育和对信息系统的信任。 “模型基于自身输出进行训练”的风险³³ 可能造成一个反馈循环,随着时间的推移降低信息质量。
C. 搜索价值的变迁:AI时代的经济与认知影响
如果AI提供直接答案,用户可能会绕过传统的搜索引擎结果页面(SERPs)及其链接的网站³⁶。高德纳咨询公司预测,到2026年,传统搜索引擎流量将下降25%³⁹。用户直接在SERP上获得答案的“零点击搜索”正在增加(例如,通过精选摘要、AI概述)³⁸。
当前的互联网经济在很大程度上依赖于搜索引擎流量驱动的广告。如果用户不再点击链接,出版商的广告收入就会减少³⁶。随着AI平台决定其内容是否有足够价值被纳入或引用,网络出版商可能会失去控制权³⁶。这可能导致更多的付费墙和陷入困境的媒体机构。
在AI搜索时代,成功的衡量标准也随之改变,从点击量和关键词排名转向关注AI答案中的品牌提及、搜索印象/答案排名、点击之外的互动(社交讨论、来自AI的引荐流量)以及转化的辅助归因⁵²。
尽管如此,高质量内容仍然至关重要。AI搜索仍然依赖于现有的、高质量的、经过充分研究的内容⁴¹。如果此类内容减少,AI搜索的质量也会下降。为AI检索优化内容涉及结构、权威性、清晰度和深度³⁸。
从认知层面看,“搜索的价值”可能从寻找多样化来源供人类综合,转变为提示AI给出综合答案。技能的重心从信息发现和评估转向查询构建和对AI输出的批判性评估。
“搜索”的价值正在发生分化:对用户而言,通过AI获得更快、更直接的答案,其价值可能增加;而对内容创作者/出版商而言,由于流量和广告收入减少,其价值可能降低。用户获得快速答案³⁶,这对他们很有价值。然而,这意味着访问网站的点击量减少³⁹,从而贬低了依赖流量的传统出版商模式³⁶。这就造成了一种根本性的经济紧张。
AI时代可能迫使我们重新评估互联网上信息和知识的价值衡量与变现方式,可能催生广告之外新的经济模式。如果广告模式瓦解³⁶,出版商将需要新的收入来源。订阅模式可能会变得更加普遍,或者出现对AI引用内容进行微支付,或者AI公司与内容创作者之间达成直接授权协议。“免费”接入、广告资助的模式正受到威胁。
认知上的转变意味着“知道如何搜索”演变为“知道如何与AI对话并批判性地审视AI”。这对教育以及在AI无处不在的世界中培养批判性思维能力具有深远影响。 “搜索”行为本身变得不那么侧重于寻找原材料,而更多地侧重于完善AI提供的成品。
五、 导航下一前沿:信息获取的未来与持久的人类需求
本结论部分将综合研究结果,展望未来,思考在AI驱动的世界中,人类对信息的基本需求将如何得到满足,以及哪些新的核心概念将定义这一新格局。
A. 新兴模式:AI原生访问、多模态交互与人机协作
- AI原生系统 指的是将AI作为核心构建的技术,而非附加功能。AI原生处理使设备能够更直观地执行高级任务(例如,照片应用无需标签即可识别物体)⁵³。这些系统具有适应性、动态性和结果导向性,由AI管理其生命周期⁵⁴。
- AI(通过自然语言处理、情感识别、自适应界面、情境感知计算)正在使人机交互(HCI) 更加自然、直观、个性化和包容⁴⁷。对话式AI、创意设计自动化和增强的个性化是其关键影响⁴⁸。
- 未来的模式强调人机协作,利用AI的数据处理能力以及人类的创造力、同理心和批判性思维⁵⁵。AI可以通过处理常规任务、识别异常情况和提出假设来协助人类专家⁵⁶。这意味着一种伙伴关系而非完全替代,需要人与AI之间共享理解和情境意识⁵⁶。
- 未来的信息生态系统 将以互联智能、统一数据平台和AI丰富的数字基础设施为特征⁵⁷。信息生态系统是由共同思想维系并通过从字母表到AI等技术连接起来的社群⁵⁸。人依然是根本。
信息获取的未来很可能是深度嵌入、高度个性化和交互式的,超越当前的“搜索框”范式,AI将无缝集成到各种设备和工作流程中。AI原生原则⁵³ 表明AI是核心组件,而非外部工具。增强的HCI⁴⁷ 指向更自然和自适应的界面。多模态AI⁴³ 允许超越文本的交互。这种融合预示着未来“搜索”不再是一个独特的行为,而是一种无处不在的能力。
有效的人机协作将成为一项关键技能,要求人类善于引导AI、解读其输出并理解其局限性。文献⁵⁵ 强调伙伴关系。如果AI处理数据处理和初步综合,人类的角色将转向批判性评估、伦理监督和创造性应用。这意味着人类技能与AI发展同步进化。未来信息系统的设计不仅要优先考虑AI能力,还要优先考虑人机交互和协作的质量,以确保技术增强而非削弱人类的智力和能动性。
B. 超越“搜索”:识别新信息生态系统的核心概念
信息查找行为可能涉及更少的传统搜索,而更多地依赖熟练的提示工程⁴⁶、对话式交互⁴⁵ 以及对AI生成输出的批判性验证³³。
下一代AI(搜索)系统的核心组成部分包括:感知(收集数据)、推理(处理信息,使用规则或机器学习)、行动(物理或数字)、学习(持续改进)和沟通⁵⁹。这些组件使系统能够自主、自适应地运行。
新时代的关键概念包括:
- 意图理解: AI超越关键词,深入把握用户需求的能力³²。
- 情境化: 提供与用户特定情况、历史和环境相关的信息³²。
- 综合与生成: AI基于检索到的信息创建新的摘要、解释或内容的角色³³。
- 个性化: 为个体用户量身定制信息访问和呈现方式³²。
- 信任与透明: 理解AI如何得出答案并确保可靠性的重要性日益增加³⁶。
- 能动性与控制: 在AI提供辅助与用户保持对其信息发现和决策过程的控制之间的平衡。
取代或增强“搜索”的“核心概念”可能是“AI中介的知识导航”或“智能信息综合”,强调AI在处理和呈现信息方面的主动作用,而不仅仅是定位信息。传统搜索是关于查找文档¹⁵。AI搜索是关于获取答案³⁶。这意味着从用户驱动的原始来源导航转向AI驱动的已处理知识的传递。“核心要素”不再仅仅是索引和排名,而是理解、推理、生成和对话⁵⁹。
尽管工具发生了巨大变化,但理解、解决问题和连接等根本的人类需求(见第一节B部分)仍然是最终的驱动力。用户在其疑问中探寻“根本需求”以及它们将如何得到满足。像AI(LLM、RAG等)这样的技术是满足这些旧有需求(例如,对确定性、成长的需求)的新方法。未来系统的成功将取决于它们与这些深层人类驱动力的契合程度。重点可能从搜索行为本身转向互动质量和结果效用。“搜索”本身可能变得不那么显眼,更加融入日常,但对可靠、相关和可理解信息的需求将持续存在,甚至可能加剧。
C. 结论性视角:在不断发展的世界中探究的持久重要性
回顾“搜索”的演变历程,它从一个简单的动词发展成为一个复杂的、由数字和AI驱动的过程。AI更像是增强人类能力并改变搜索形态,而非完全取代人类监督、批判性思维和战略性内容创造的需求。技术性SEO和高质量内容依然至关重要³⁹。未来很可能是人机协作在信息搜寻领域占据主导地位⁵⁵。
即使传统搜索引擎被边缘化,人类探究、探索和寻求理解的基本驱动力仍将持续存在。“搜索”的价值(广义上)依然存在,只是其方法会改变,但需求不变。未来的挑战在于,在驾驭AI在信息获取方面的风险(如错误信息、偏见、中心化、经济颠覆)的同时,充分利用其益处。对伦理准则、透明度和用户赋权的需求日益迫切³⁶。
正如用户所提出的,传统搜索引擎的价值可能被“大大冲淡”,但这更准确地说是一种价值在信息搜寻过程中的转型和重新分配。价值可能从查找链接的行为转向制定有效提示和批判性评估AI综合答案的行为。如果AI提供了“什么”(答案),那么人类的价值就转向了“为什么”(潜在需求,对答案有效性及其影响的批判性评估)。“搜索”变成了一个审视AI的内部认知过程,而不是筛选链接的外部过程。
信息获取的未来将要求对“信息素养”有更深入的理解,包括AI素养、对算法输出的批判性思维和伦理意识。用户在其疑问中含蓄地询问知识获取的未来。如果AI是新的中介,那么理解AI如何工作、其偏见及其局限性,对于任何寻求知识的人来说都至关重要。这是AI角色日益增长的直接后果。
归根结底,人类对知识和理解的基本需求,这一直是驱动“搜索”的根本动力,将继续作为主要引擎。社会面临的挑战是,塑造AI和未来的信息生态系统,使其真正赋能这一探索,而不是制造新的依赖形式或错误信息。无论使用何种工具,重点都应放在培养批判性探究能力上。人类对知识的根本追求,即广义上的“搜索”所代表的,将在AI时代继续适应并找到新的表达方式。核心挑战是确保这些新的表达方式服务于人类的繁荣发展。
参考文献
- 1: SEARCH Definition & Meaning - Merriam-Webster
- 2: SEARCH Definition & Meaning | Dictionary.com
- 3: Etymology of "search" by etymonline
- 4: INFORMATION -SEEKING BEHAVIOR | OER Commons
- 5: (PDF) INFORMATION SEEKING BEHAVIOR: AN OVERVIEW
- 6: Assessment of drivers' visual search patterns and cognitive load during driving in curved tunnels - PubMed
- 7: Full article: Assessment of drivers' visual search patterns and cognitive load during driving in curved tunnels
- 8: The 6 Human Needs: Understanding What Drives Us - Early Years TV
- 9: 6 human needs: why are they so important? | Tony Robbins
- 10: Oral Tradition | Milwaukee Public Museum
- 11: Celebrating Native Cultures Through Words: Storytelling and Oral Traditions
- 12: Memory and the Printing Press - Farnam Street
- 13: The Gutenberg Printing Press - Duke Computer Science
- 14: Libraries and archives industry | EBSCO Research Starters
- 15: History of libraries - Wikipedia
- 16: History of Information Retrieval - Coveo
- 17: How did people look stuff up before the internet? : r/NoStupidQuestions - Reddit
- 18: www.site.uottawa.ca
- 19: Archie (search engine) - Wikipedia
- 20: A Short History of Online Search | | InformIT
- 21: A Brief History of Yahoo – CanvasBusinessModel.com
- 22: What the Internet Was Like in 1994 | Cybercultural
- 23: The Evolution of SEO: A History of Search Engine Optimisation
- 24: Search Engines: Guiding You in the Digital World
- 25: The Evolution of Online Search: Early Search Engines Before Google - LION Digital
- 26: The Evolution of AI Search: Past, Present, Future - Rocket Farm Studios
- 27: The SEO Evolution: The History of Search Engines and SEO - SEOwind
- 28: Evaluating Search Engines & Web Directories - Moorpark College
- 29: Search Engines and Subject Directories - Tutorial - Vskills
- 30: The Importance of Search Engines - Skillfloor
- 31: Google Portal & SEO: Impact on Search & Digital Marketing - Repindia
- 32: The Evolution of Search - AI SEO vs. Traditional SEO - Web Design West Midlands
- 33: Information Retrieval in the Age of Generative AI: The RGB Model - arXiv
- 34: The Future of SEO: How AI Is Already Changing Search Engine Optimization - ResearchFDI
- 35: AI and the Future of SEO: How AI-Powered Chatbots are Evolving the World of Search
- 36: AI And The Future Of Search: How We Broke The Web And What ...
- 37: How Retrieval-Augmented Generation is Redefining SEO - iPullRank
- 38: SEO in the Age of AI Search Engines | Mad Genius
- 39: AI Search is Changing Everything: What Your Business Can't Afford to Miss | LQ Digital
- 40: [2504.20610] Information Retrieval in the Age of Generative AI: The RGB Model - arXiv
- 41: Will AI Replace SEO: What Expert Research Suggests in 2025 - Writesonic
- 42: Workshop | 2025 ACM Multimedia - ACM MM 2025
- 43: Beyond words: AI goes multimodal to meet you where you are
- 44: The Transformative Role of Multimodal AI in Media Search and User Experiences
- 45: Conversational Information Seeking - Google Research
- 46: Conversation with an AI - How to use artificial intelligence in information searching
- 47: How AI Could Soon Take Human-Computer Interaction to New ...
- 48: How Generative AI is Redefining Human-Computer Interaction - Community.aws
- 49: Enhancing User's Knowledge Gain Estimation in Search-as-Learning Using Implied Knowledge | IEEE Conference Publication - Unpaywall
- 50: The 16th IEEE International Conference on Knowledge Graphs | AI ...
- 51: Does generating blogs with AI gets penalized in the search ranking system? - Google Help
- 52: Measuring Success In The Age Of AI Search: 4 Key Metrics To Track - Forbes
- 53: AI Native — What Does It Mean for Embedded Processing? - Synaptics
- 54: What Is AI Native? - Splunk
- 55: Full article: Encouraging human-AI collaboration in interactive learning environments
- 56: vision of human–AI collaboration for enhanced biological collection curation and research | BioScience | Oxford Academic
- 57: How industrial intelligence shapes information ecosystems - The World Economic Forum
- 58: Assessing National Information Ecosystems | Carnegie Endowment for International Peace
- 59: Learn the Core Components of AI Agents - SmythOS
- 60: The Core Components of AI Agents: How They Perceive, Learn, Reason, Act, and Communicate - TeckNexus
- 61: Will AI Replace SEO? The Future of Human Expertise - Outranking
- 62: Personalized Recommendations: A Guide to Tailored Experiences - Couture AI
- 63: On explaining recommendations with Large Language Models: a review - Frontiers
- 64: Harnessing the power of AI in academic libraries