正确的提示信息

扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词
2023-09-14 18:25
低调的PDF,为什么成了数字文档“永远的神”?

本文来自微信公众号:游戏研究社 (ID:yysaag),作者:SulfuriumUranide,题图来自:视觉中国

文章摘要
本文介绍了PDF作为数字文档的重要性和广泛应用。从特朗普的涉案事件到PDF的发展历程,作者详细讲述了PDF格式的起源和演变。

• PDF格式在特朗普涉案事件中发挥了关键作用,成为定罪的关键证据之一。

• Adobe公司创始人沃诺克和格施克的合作开发了PostScript和PDF格式,为数字文档的制作和传播奠定了基础。

• PDF格式经过多年发展,已成为全球标准的数字文档格式,广泛应用于各行各业。

谨以此文缅怀Adobe联合创始人John Warnock博士(1940年10月6日–2023年8月19日)和Charles Geschke博士(1939年9月11日–2021年4月16日)。


2023年8月21日,美国前总统唐纳德·特朗普在他创建的社交平台“Truth(真实社交)”上发文表示,他将赴亚特兰大就涉嫌推翻2020年总统选举佐治亚州结果向该州司法当局自首。


同一天的早些时候,设计软件开发商Adobe官网发布讣告,公司联合创始人约翰·沃诺克(John Warnock)去世,享年82岁。


至少从事了一辈子出版与设计软件研发的沃诺克再也不用忍受如此糟糕的排版。


并不会有谁把这两条看起来风马牛不相及的新闻联系起来,但是可能早在三十年前的冥冥之中,命运的齿轮就已转动起来。


1993年Adobe正式发布史上第一款用于制作.pdf文件的软件Adobe Acrobat 1.0。


时间暂时回到2018年初,早已官司缠身的特朗普前竞选团队主席保罗·马纳福特(Paul Manafort)又遭受了沉重的一击。负责调查“通俄门”事件的时任美国司法部特别检察官,对马纳福特及其合伙人提出了新的指控。


比起在自家地下室搭建私人电子邮件服务器用于处理公务的美国前国务卿希拉里,拥有乔治敦大学工商管理学士和法律博士学位的马纳福特和威廉玛丽学院毕业的高材生合伙人Gates简直就是技术战五渣。


起诉书中特别提到的一个细节是,马纳福特想要通过伪造公司收入提高贷款额度,但他不知道如何编辑.pdf格式的损益表。因此他通过邮件让合伙人先把.pdf表格转换为Word文档再发给他,之后又把虚增了数百万美元收入的伪造表格发回,后者帮他重新转换成.pdf,成为马纳福特提供给贷款公司材料的一部分。这一系列邮件往来为司法调查提供了实锤,也成了最终给他定罪的关键证据之一。


专精《反海外腐败法》和白领犯罪辩护的律师及法律博主Susan Simpson截图起诉书发推表示“已无力吐槽”。


就连国际PDF协会(PDF Association)也跑来补刀,非常专业地指出马纳福特的做法十分愚蠢,由于字体替换等技术因素,从.pdf文件转换得到的Word文档很容易出现外观上的不一致,直接破坏文档的真实性。


另外马纳福特的一通神操作纯属画蛇添足,因为这种非加密的.pdf文件完全可以用Adobe Acrobat等编辑软件直接修改。最后直接嘲讽拉满:他甚至都没Google一下“在PDF中编辑文字”。


一语双关的标题杀人诛心,corruption一词既指.pdf文件的损坏又讽刺马纳福特靠伪造.pdf文件搞腐败。


让我们充分见识到了“最高端的骗局往往采用最愚蠢的方式”的PDF文件格式,不仅已经低调出道整整三十年了,而且早就以电子书、说明书、学术论文以及各色表格甚至直接用微信不便转发的“学习资料汇编”等形式渗透到了普通人生活和工作的方方面面。


根据2018年国际PDF协会的估算,.pdf文件的总数量早已达到数万亿,并且每天还在以数十亿计新增。但每每提及发明且推广了PDF的Adobe公司,人们可能最先想到的是Photoshop,毕竟PS或者“P图”已经成为了编辑图片的代名词。


关键时刻还得是Photoshop拿得出手,不过话说回来就算Photoshop再牛,说明书也得是PDF格式的。


虽然PDF并非Adobe的第一款产品,但整个公司的创立可以说和PDF密不可分。1970年代的打印机并不能像今天一样可以随意打印任意文字和图像,简单来说就是计算机没法有效准确地告诉打印机该怎么去工作。



常见的点阵打印机(上)只能应付简单的文字输出,而能够绘制复杂图形的专业绘图仪(下)又贵又慢,后者和今天的智能写字机器人其实是一回事。


时间继续回到1978年,已经在计算机图形学领域小有成就的沃诺克博士加入了由查尔斯·格施克(Charles Geschke)博士领衔的施乐Palo Alto研究中心(PARC)图像科学实验室,两人合作开发了InterPress页面描述语言,能够用来驱动施乐开发的激光打印机,相当成功地解决了复杂图文页面的打印问题。


施乐的领导层认为InterPress是一项有前景的技术,但是竟然由于担心会很快被竞争公司山寨,决定将InterPress雪藏,仅作为内部标准使用。


施乐PARC当年简直就是硅谷“芝麻开门”的宝藏,最著名的要数配备了图形用户界面(GUI)和鼠标的Xerox Alto系统,Apple创始人Steve Jobs见了就像猫看见老鼠一样馋得不行,造就了后来Macintosh系列的传奇。


倍感沮丧的沃诺克和格施克于1982年底双双辞职,合伙在沃诺克家的车库成立了新公司,跟乔布斯白手起家的历程几乎如出一辙。


公司名字则来自沃诺克家后面的一条小溪Adobe Creek,感觉多少有些随意潦草,却完全不落当年创业公司普遍追求QXYZ这些有未来科技感字母的俗套。照片中左为格施克,右为沃诺克,背景正是Adobe Creek。


两人在InterPress的基础上,很快就开发出了属于Adobe的新的页面描述语言PostScript,可以准确、简单地用线条和色彩填充描述打印内容。作为第一个能够打印包含文字、图形和数码照片的软件,PostScript给打印技术打来了革命性突破,也成为日后PDF格式的核心基础。


Adobe公司logo的最初设计稿与变迁,唯一不变的是看起来像开放三角形的首字母A,由沃诺克的妻子、平面设计师Marva亲手设计。而大名鼎鼎的矢量图形软件Adobe Illustrator最初则是Warnock为了帮助Marva简化很多手动操作开发的自动化工具。如此琴瑟和谐是否也值得国内互联网大佬们学习?


尽管PostScript的页面描述效率已经非常高,但还是远远超出当时个人电脑的硬件能力范围,因此沃诺克和格施克最初将PostScript的服务对象定位在大型印刷工作站,直到乔布斯适时出现,改变了PostScript和Adobe公司的未来。


乔布斯认为,如果电脑配套的打印机能够用来制作高质量的商业文件,将为Apple带来无可比拟的优势。在乔布斯的劝说下,Adobe将PostScript授权给Apple的网络打印机LaserWriter。为此乔布斯花费250万美元收购Adobe 19%的股份,并追加100万美元购买PostScript的专利许可。



价格昂贵和缺陷颇多并没有妨碍LaserWriter取得巨大商业成功,进而为Apple成为桌面出版领域霸主奠定了基础,Adobe也因此一举成名。


1987 年,PostScript 已成为行业标准打印机语言,Adobe 与包括IBM和德州仪器在内的19 家打印机公司签订许可协议。即使是最初拒绝以任何方式认可该语言的惠普公司也被迫采用 PostScript。1989年Apple以8900万美元出售当初购买的Adobe股票,不到六年间增值了近四十倍。


即便在PCL(打印机命令语言)协议已经成为业界标准的今天,高端打印机依然是PostScript的天下。


随着计算机性能按摩尔定律迅速提升,通过PostScript在个人电脑上直接显示复杂文档已经不是难题。1991年Warnock启动了代号为Camelot的项目,旨在创建一种可以跨操作系统的通用文件格式,且在不同品牌型号打印机上的输出效果保持完全一致,也就是说要开发传统纸张的数字版本,随后演化为Portable Document Format(PDF),即便携式文档格式。


很显然根据Google搜索结果,PDF的通用程度已经够得上全球第四大宗教了。


1993年,Adobe正式发布了售价700美元的PDF制作软件,同时PDF阅读器也卖到了50美元。


昂贵的价格和当时仍处在龟速的互联网,注定了PDF并不能像PostScript一样面世即爆款,甚至一度Adobe的董事会要取消PDF项目,不过事情也很快迎来了转机。美国国税局IRS最头疼的事之一就是每年要分发数以亿计的税表,作为可靠的电子文档格式的PDF就成了最佳选择。到了1996年的报税时节,IRS启动PDF格式税表下载服务,一口气提供了600多种各色税表。


成为IRS“御用”税表格式之后,PDF很快就在商业界得到了广泛应用,随后也迅速得到了学术界、法律界等行业的认可。虽然在初期也面临不少竞争,但是脱颖而出的PDF短短数年内就变成了数字文档的全球标准。


最初由AT&T实验室开发的DjVu格式在命名上玩得一手好梗,是法语Déjà vu既视感的缩写,主打一个高保真还原,也曾是PDF的强劲对手。


2008年,PDF格式迎来了历史性的一刻,Adobe授权ISO发布并最终控制该格式的规范,并且可以免费使用相关专利。新的PDF标准也在不断提升交互性并融入更多面向未来需求的功能。


同时旨在实现最大程度还原原始文档的PDF/A格式也成了数字化古籍和历史文档的不二选择。至于知网CAJViewer和超星阅读器好不好用大家心里都有数…… 


凭一己之力为PDF格式奠基的沃诺克,在世人眼中必定是学神一样的存在。事实上,沃诺克早在犹他大学获得数学学士和硕士学位后转行攻读计算机时,就提出了确定隐藏表面的Warnock算法,使计算机能够渲染的内容从只有线条扩展到实体对象,是现在计算机图形学中的必学基础内容。


在他总篇幅26页的博士论文中,沃诺克没用一行代码,仅凭文字叙述和示意图阐明了算法,也为自称“犹他大学历史上最短的博士论文”而洋洋自得。


Warnock算法还登上了著名科普杂志《科学美国人》1970年6月的封面,其重要程度可见一斑。


但大家可能想不到的是,沃诺克在中学时成绩平平,甚至在九年级时数学考试挂科。虽然流露出对工科专业的兴趣,但是辅导员却告诉他想都不要想。幸好高中的一位数学老师提起了沃诺克对数学的兴趣,从此数学成绩一路全A。到了硕士阶段,沃诺克凭自己的兴趣证明了抽象代数中一项数年悬而未决的定理。


沃诺克发表在《美国数学会汇刊》(Transactions Of The American Mathematical Society)上证明论文的PDF格式文档截图,每个单词都很具体但是放在一起就变抽象了。


与好友沃诺克相比,格施克的人生也不乏传奇色彩。诞生在罗马天主教家庭的格施克从耶稣会高中毕业后曾在神学院就读一年,但之后就放弃了成为神职人员的追求转而到Xavier大学学习古典学。拿着古典学的本科学位,格施克又接着读了数学硕士,1963年就在John Carroll大学当起了教授。


多年后重回Xavier大学被授予荣誉学位以及重登John Carroll大学讲台的格施克。


格施克的人生转折就发生在这个期间,当时他开除的一名差生转年回来告诉他,“你把我轰走可真是积了大德了”。这名学生辍学后找到了一份为通用电气销售计算机的高薪工作,而且不计前嫌地教会了格施克如何在当时的大型主机上编写计算机程序。


从此,格施克似乎一下爱上了编程,他编写的简单程序之一是打印用于宣布女儿诞生喜讯的信封。不久之后,格施克申请到了美国自然科学基金(NSF)的奖学金,转行进入卡内基‧梅隆大学的计算机科学系攻读博士学位,拉开了他在计算机领域辉煌事业的序幕。人们常说“名师出高徒”,像这样“劣徒成就名师”的例子怕是并不多见。


很有意思的是,格施克的父亲是一名印刷公司的制版师,经常告诫他要避免两件事:印刷业和股票市场。


恐怕他俩谁也不会想到,若干年后Geschke会创办一家为印刷出版行业服务且在纳斯达克上市的公司。


2009年,沃诺克和格施克被时任美国总统、同时也是特朗普的前任总统奥巴马授予全美为技术成就颁发的最高奖项——美国国家技术创新奖National Medal of Technology and Innovation。


尽管跟早就获此殊荣的乔布斯(1985年)和比尔·盖茨(1992年)相比有些迟到,但绝对算得上实至名归。


恐怕十数年之后,特朗普不会想到自己的命运会与二人发明的PDF关联起来。时间再倒回到两百多年前,跟特朗普诸多治国理念一致的美国国父之一本杰明·富兰克林写下过广为流传至今的一句名言:“世界上只有两件事是不可避免的,那就是税收和死亡”。


倘若富兰克林生在今天,我想一定会加上第三件事吧


*本文作者SulfuriumUranide,有机化学博士,毕业于美国达特茅斯学院,现任国际顶级化学期刊《应用化学(Angewandte Chemie)》执行编辑,曾在美国能源部国家能源技术实验室从事博士后研究,并先后担任《先进材料(Advanced Materials)》和《自然·化学(Nature Chemistry)》等知名期刊学术编辑。此前曾为我们带来《为了讲故事,人类到底虚构了多少化学元素?》一文。


参考资料:

https://www.nytimes.com/2021/04/20/technology/chuck-geschke-dead.html

https://www.vice.com/en/article/pam43n/why-the-pdf-is-secretly-the-worlds-most-important-file-format 

https://knowledge.wharton.upenn.edu/article/adobe-acrobat-at-20-successes-second-guesses-and-a-few-miscues/

https://marker.medium.com/the-improbable-tale-of-how-the-lowly-pdf-played-the-longest-game-in-tech-d143d2ba9abf

https://slate.com/technology/2018/02/paul-manafort-couldnt-convert-pdfs-to-word-documents.html


本文来自微信公众号:游戏研究社 (ID:yysaag),作者:SulfuriumUranide

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文

支持一下

赞赏

0人已赞赏

大 家 都 在 看

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: