人工沟通与法:算法如何生产社会智能
上QQ阅读APP看书,第一时间看更新

人工沟通

当前的沟通革命主角是算法,但算法本身并不新奇。算法的概念至少可以追溯到中世纪,该术语本身源于“花拉子米”(al-Khwarīzmī)的拉丁化,这是9世纪一位波斯数学家的名字。有关花拉子米(al-Khwarīzmī)的更多信息,参见CHABERT J-L, ed. Chabert, Jean-Luc, ed. A History of Algorithms. From the Pebble to the Microchip [M]. Berlin-Heidelberg: Springer, 1999.译者注:关于花拉子米的生平,目前所掌握的资料甚少,甚至连他的出生地也未能确定。他的《代数学》是第一本解决一次方程及一元二次方程的系统著作,因此被称为代数的创造者。新鲜之处是最近利用了大数据和机器学术技术,使算法缺乏智能这一特殊的特征成为可能。

算法的优势一直在于其执行过程中不需要任何“创造性”思想。DAVIS M. Computability and Unsolvability [M]. New York: McGraw-Hill, 1958.与计算机一样,它们根据精确的指令按顺序机械地执行运作。ESPOSITO E. Algorithmische Kontingenz: Der Umgang mit Unsicherheit im Web [M]//CEVOLINI A. Die Ordnung des Kontingenten: Beiträge zur zahlenmäßigen Selbstbeschreibung der modernen Gesellschaft. Wiesbaden: Springer VS, 2014: 233-249.而在经典人工智能中,算法是计算结果必须执行的一系列动作,而在机器学习中,该术语表示为使机器学习人们想要获得的区分而执行的动作序列。在第一种情况下,执行算法意味着进行计算;在第二种情况下,它意味着调整(tuning)系统。作者感谢Stefano Borgo的澄清。在算法以及依赖于算法的数据的数字管理中,信息处理和映射与理解无关——事实上,在许多情况下,对理解的需求反而会成为障碍。Peng在LeCun vs Rahimi中问道,我们是想要更有效的机器学习模型而没有明确的理论解释,还是更简单、更透明但在解决特定任务方面效率较低的模型?甚至有人声称,在机器学习领域,某种不可解释性可能是一个积极因素,因为不精确和错误会使算法的工作更加灵活,并被数据的增加所抵消。参见MAYER-SCHONBERGER V, CUKIER K. Big Data. A Revolution That Will Transform How We Live, Work and Think [M]. London: Murray, 2013.随着要分析的元素数量的增加[达到今天令人难以置信的拍字节(petabytes)和皆字节(zettabytes)],这些机器的运作变得越来越难以理解BURRELL J. How the Machine Thinks: Understanding Opacity in Machine Learning Algorithms [J]. Big Data & Society, 2016(1): 1-12.——但它们的性能不仅没有下降,而且逐渐变得更加精确和可靠。还有其他方法来测试数字机器程序的正确性。

算法的沟通相关性实际上与它们理解的独立性有关。我们面临着一种不同于人类信息处理和理解的数据处理(和管理信息)方式。BORGO S. Ontological Challenges to Cohabitation with Self-Taught Robots [J]. Semantic Web, 2020, 11(3): 161-167.笔者的假设是,这种差异不是一种责任,而是这些技术成功的根本所在。正如人类最初实现了飞翔,是因为他们放弃了制造像鸟一样拍动翅膀的机器的想法,关于汉斯·布鲁门伯格(Hans Blumenberg)的隐喻,参见BLUMENBERG H. Nachahmung der Natur: Zur Vorgeschichte der Idee des schöpferischen Menschen [J]. Studium Generale, 1957(10): 266-283.在放弃以数字形式再现人类思维进程的雄心之后,数字信息处理成功地实现了我们今天看到的结果。如今算法不再试图模仿我们的意识,算法已经变得越来越能够充当有能力的沟通伙伴,适当地回应我们的请求,并提供人类思维无法构建或重构的信息。从人类行为中逐步自主的想法并不新鲜:所有媒体都引入了一种沟通形式,这种沟通形式在某些方面从与人类过程的直接协调中变得自主,参见LUHMANN N. Die Gesellschaft der Gesellschaft [M]. Frankfurt am Main: Suhrkamp, 1997: 216-217。在书面沟通中,伙伴不必在场,而媒体和大众媒体甚至不要求他们了解彼此或曾经见过的任何事情。读者产生自己的沟通,其节奏、时间和顺序可能与发送者的完全不同。接收者获得的信息越来越独立于发送者的想法。然而对于算法,显然发送者不需要考虑任何信息。

这在我们对算法的实际使用中已经表现得很明显,但在我们对它们的理论研究中并不总是如此。大数据和机器学习领域里使用的隐喻保留了对人类思维及其过程的参考。举个例子,人们普遍认为最近的深度学习程序之所以如此有效,是因为它们基于生物神经网络复制了人脑的功能。然而,正如大多数研究人员承认的那样,GOODFELLOW I., BENGIO Y., COURVILLE A. Deep Learning [M]. Cambridge, MA: MIT Press, 2016: 15;WOLCHOVER N. AI Recognizes Cats the Same Way Physicists Calculate the Cosmos [EB/OL]. [2014-12-15]. https://www.wired.com/2014/12/deep-learning-renormalization/.我们对大脑的运作仍然知之甚少,这使得这个类比非常奇怪——将我们的无知作为模型是否有意义?在试图建造一台思考机器的过程中,科学家们迄今为止只成功地重申了我们大脑如何思考的奥秘。SEABROOK J. Can a Machine Learn to Write for the New Yorker? [N]. New Yorker, 2019-10-14.如果机器不再试图理解人类头脑中发生的意义,我们不应该找到一种不同的、更合适的隐喻吗?

最近的大数据方法与20世纪70年代和20世纪80年代的AI研究计划有很大不同,后者旨在通过机器模仿或类比(分别为“强”或“弱”人工智能)再现人类智能的过程。SEARLE J R. Mind, Brains and Programs [J]. Behavioral and Brain Sciences, 1980, 3(3): 417-457.现在已经不是这样了。正如一些人工智能设计师明确宣称的那样,“我们不会试图复制智能”SOLON O. Weavrs. The Autonomous, Tweeting Blog-Bots That Feed on Social Content [EB/OL]. [2012-03-28]. https://www.wired.co.uk/article/weavrs-spambots-or-discoverability-agent.——因为这将是一个太重的负担。翻译程序不会试图理解它们翻译的文件,它们的设计者也不依赖任何语言学习理论。BOELLSTORFF T. Making Big Data, in Theory [J/OL]. First Monday, 2013, 18(10).算法在不懂中文的情况下,可以从中文翻译文本,它们的程序员也不懂中文。拼写检查器可以纠正任何语言的印刷错误,但它既不了解这些语言,也不了解它们的(变化的)习俗。数字助理在不理解单词含义的情况下使用文字,生成文本的算法“不会像人一样推理,以便像人一样写作”。HAMMOND K. Practical Artificial Intelligence for Dummies [M]. Hoboken NJ: Wiley, 2015: 7.这些例子在算法最成功的所有领域中都成倍增加。在国际象棋、扑克和围棋中,与人类玩家竞争的算法既不了解游戏,也不了解人类策略的巧妙之处。SLIVER D, HASSABIS D. AlphaGo: Mastering the Ancient Game of Go with Machine Learning [EB/OL]. [2016-01-27]. https://research.googleblog.com/2016/01/alphago-mastering-ancient-game-of-go.htm. 2017年1月击败最优秀人类玩家的扑克AI Libratus的程序员表示,它开发了一种完全独立于人类游戏的策略,它可能与人类玩游戏的方式大不相同。METZ C. Inside Libratus, the Poker AI That Out-Bluffed the Best Humans [EB/OL]. Wired [2017-02-02]. https://www.wired.com/2017/02/libratus.使用协同过滤的推荐程序对它们推荐的电影、歌曲或书籍一无所知,但运行起来它们却是可靠的时尚引领者。GROSSMAN L. How Computers Know What We Want——Before We Do [N]. Time, 2010-05-27; KITCHIN R. Big Data, New Epistemologies and Paradigm Shifts [J]. Big Data & Society, April 2014.基于计算机的人格判断“自动进行,并不会涉及人类的社会认知技能。”YOUYOU WU, KOSINSKI M., STILLWELL D. Computer-Based Personality Judgments Are More Accurate Than Those Made by Humans [J]. Proceedings of the National Academy of Sciences, 2015, 112(4): 1036.

这些程序不是在复制智能,而是在复制沟通能力。与算法的智能无关,使算法具有社会相关性和实用性的是它们在沟通实践中充当合作伙伴的能力,这些沟通实践产生和传播信息。我们可以说机器学习程序实现的不是人工智能,而是一种人工沟通(artificial communication),为人类提供了不可预见和不可预测的信息吗?也许我们整个社会变得“更智能化”,不是因为它人工地复制了智能,而是因为它以不同的方式使用数据创造了一种新的沟通形式。

社交媒体的巨大成功证实了互联网的重点在于沟通而不在于智能,这在任何数字演化模型中都没有预见到。今天的网络更多地通过联系人、链接、推文和喜好来组织,而不是通过内容之间和站点之间有意义的联系ROGERS R. Digital Methods [M]. Cambridge, MA: MIT Press, 2013: 155; VIS F. A Critical Reflection on Big Data: Considering APIs, Researchers and Tools as Data Makers [J/OL]. First Monday, 2013, 18(10), https://doi.org/10.5210/fm.v18i10.487.——它是由沟通驱动的,而不是由意义和理解驱动的。社会事实和个人观点之间的区别似乎正在消失,参见LATOUR B. Beware, Your Imagination Leaves Digital Traces [N]. Times Higher Education Literary Supplement, April 6, 2007.每个链接(每个沟通行为)都被视为一个“喜好”(like),“在喜好中”(liking)和“正对此产生喜好”(being like)也被等同起来了。SEAVER N. Algorithmic Recommendations and Synaptic Functions [EB/OL]. http://limn.it/algorithmic-recommendations-and-synaptic-functions.网上发生的一切都被当作事实,从而成为事实、形成结果,并产生信息。