古腾堡计划

古腾堡工程(Project Gutenberg,缩写:PG),由志愿者参与,致力于将文化作品的数字化和归档,并鼓励创作和发行电子书。该工程肇始于1971年,是最早的数字图书馆。其中的大部分书籍都是公有领域书籍的原本,古腾堡工程确保这些原本自由流通、自由檔案格式,有利于长期保存,并可在各种计算机上阅读。截至2018年7月,古腾堡工程声称超过57,000件馆藏。

在可能的情况下,发布的格式是纯文本文件,但也包括其他格式,如HTMLPDFEPUBMOBIPlucker。大多数版本使用的语言是英语,但也可以有许多非英语的作品。有多个相关项目,提供更多的内容,包括区域性的和特定于语言的作品。古腾堡计划也密切联系Distributed Proofreaders,一个校对扫描文本的以互联网为基础的社区。

古腾堡工程
(Project Gutenberg)
Project Gutenberg logo
基本信息
建立时间 1971年12月1日
(最初文档发布)[1]
收藏
规模 超过 57,000 个文档
官方网站 gutenberg.org

历史

古腾堡工程由Michael Hart(1947年-2011年)于1971年启动。当时Hart是伊利诺伊大学的学生,他获得了学校材料研究实验室中Xerox Sigma V大型计算机的使用权限。通过和善的操作员,他得到一个几乎没有时限的帐号,后来估算这价值约100,000乃至100,000,000美元不等。Hart想通过做一些有价值的事情,作为这份馈赠"物有所值"。

这台计算机是阿帕网(全球互联网的鼻祖)的15个节点之一。Hart认为有朝一日公众都可以接触计算机,因而他决定将书籍电子化,供人们自由使用。刚好他背包里有一份美國獨立宣言,该宣言也就成了古腾堡工程的的第一份电子文本。

该工程的命名是为了纪念约翰内斯·古腾堡,他是一位德国15世纪的印刷商,通过推广使用活字印刷术推动了印刷机的革命。

1990年代中期,Hart在伊利诺伊本笃会学院进行该项目,更多的志愿者参与了进来。在图像扫描仪光学文字识别软件得到改进并被广泛使用前,大部分文本都是靠手工输入。

Hart后来与卡内基梅隆大学达成协议,由对方主导古腾堡工程的财务。随着电子文本的增加,志愿者开始替代Hart,进行日常的维护操作。

2000年,非營利組織古腾堡工程著作归档基金会 (The Project Gutenberg Literary Archive Foundation Inc) 在密西西比州获准成立,以处理相关的法律事务。给古腾堡工程捐款可以得到减税的优惠。工程的长期志愿者Gregory Newby成为基金会的第一任首席执行官

同样是在2000年,Charles Franks启动了分布校对员项目,志愿者从而可以将扫描的文本通过互联网共享发布。该举措极大地提高了加入PG的数量与种类,新的志愿者也可以更容易地贡献力量。

意大利志愿者Pietro Di Miceli开发、管理了第一个古腾堡工程的网站,并着手对在线工程进行编目。在他参与的10年间(1994年-2004年),网站获得了不少奖项,常被收录到"最佳网页"列表,这也提高了工程的知名度。[2]

2004年开始,启用了新的在线目录,PG内容更容易浏览、获取和链接。

古腾堡工程现在由位于北卡罗莱纳大学的ibiblio主办。

收录范围

Project Gutenberg total books
古騰堡計畫自1994年至2015年收錄作品數量的增長

到2018年4月为止,古腾堡工程已经收录了57,000部书籍,平均每週将新增50部。

其中主要是西方文化传统中的文学作品,比如小说、诗歌、小故事、戏剧,除此之外,PG也收录食谱、书目以及期刊。另外还包括一些非文本内容,比如音频文件、乐谱文件等。

收录中主要是英文作品,但也有相当数量的德语法语意大利语西班牙语荷兰语芬兰语以及中文等不同语言的著作。

在可能的情况下,古腾堡以纯文本的格式发布,主要使用ASCII字符集,也常被扩展为ISO-8859-1,而中文书籍几乎全部都是以Big5(大五码)纯文本格式发布。志愿者提交时也可能会采用其他格式,最常见的是HTML。不容易编辑的格式,比如PDF,对于古腾堡工程的目标而言并不合适,但还是有一些这样的格式被提交。近年来,有关于XML格式的讨论,但相关进展还比较缓慢。

理想

Michael Hart在2004年有言“古腾堡工程的使命很简单:‘鼓励电子书的创建与发布。’”[3]

工程的一个口号是“推倒愚昧与无知的藩篱”,就像20世纪早期公共圖書館的兴起,古腾堡的志愿者志在继续推广文字读写,从而更好地继承文化遗产。

古腾堡工程的运作方式不是集中式的,例如,没有一项选择政策来指定要添加哪部著作,志愿者只是针对他们感兴趣的或者手头有的著作,进行工作。

版权问题

古腾堡工程根据美国版权法对其电子书进行版权验证。只有版权过期者才可以加到PG档案中来,版权失效的记录将保存以备未来参考。

与其他数字图书馆的项目不同,古腾堡工程不会在其出版物上声明新的版权,从而鼓励自由再加工、再发布。

PG的大部分书籍都依照美国的版权法律,作为公有领域发布。其中有两种书籍,一种书籍的前段会带有古腾堡工程的商标,这意味着对书籍的再利用有少量的限制,限制内容写在电子书的授权条款里头(例如修改后再发布,或者商业用途)。而如果电子书的前段没有使用商标,作为公有领域的书籍就可以不受限地再利用。

古腾堡工程也发布了一些受版权保护的书籍,根据版权所有者的说明,就有进一步的限制。

1998年的美国参议员桑尼·波诺提出并被投票通过的版权期限延长法案,将现存的版权延长了20年。这导致本来在美国将变成公有领域的许多书古腾堡工程将无法添加。

批评

古腾堡工程的书籍被指学术上不够严格,比如,缺少版本使用详情介绍,缺少最初版的封面,缺少校订工具。通过比较新舊版本,可以看到新版的电子书已经有较大改进。大部分新版的电子书都保留了版本信息以及封面。

姊妹项目

古腾堡工程的所有姊妹项目都是独立的组织,但具有同样的理念,并获准使用古腾堡工程的商标。它们一般专注于某些族群或语种。

尽管Projekt Gutenberg-DE数年前被获准使用古腾堡的名称,但由于其理念不同,所以并不是每个人都将其看作古腾堡的姊妹站。Projekt Gutenberg-DE对其产品设定版权,并将其文本限制为可浏览的网页版。

也有一些受古腾堡工程启发而创立的项目,详情可参见数字图书馆项目列表。

参考文献

  1. ^ Hart, Michael S. United States Declaration of Independence by United States. Project Gutenberg. [17 February 2007].
  2. ^ https://www.gutenberg.org/about/credit
  3. ^ https://www.gutenberg.org/about/faq0

外部链接

中古英语

中古英语是指1066年到1489年间所使用的英语。这个时期的英语和古英语相比,在读音和拼写,词汇和语法方面都产生了较大的变化。一大部分古英语词汇被淘汰,转而吸收了很多法语和拉丁语的词汇。

互联网档案馆

互联网档案馆(英語:Internet Archive)是一個非營利性的數位圖書館组织。成立于1996年,由Alexa创始人布鲁斯特·卡利创办。提供數字資料如網站、音樂、動態圖像、和數百萬書籍的永久性免費儲存及獲取。迄至2012年10月,其信息儲量達到10PB。除此之外,該檔案館也是網絡開放與自由化的倡議者之一。

其數據是由自帶的網絡爬蟲自動搜集的,其網站典藏檔案館網站時光機,抓取了超過1500億的網頁。

其年度預算約为1000萬美元,來源則是其網頁爬蟲服務、合作關係、贊助以及卡利-奧斯丁基金會。總部位於舊金山里奇蒙德區,此地僱員只有數十人,大部份僱員工作於書籍掃描中心,在紅木城也有數據中心。

該數據庫是國際網際網路保留協會成員,2007年被加利福尼亞州選為官方指定圖書館。档案馆收集的数据是各种各样的。截止2015年年初,互联网档案馆共收录了2400款MS-DOS游戏。

十日談

《十日談》(Decameron )是義大利文藝復興時期作家乔万尼·薄伽丘所著的一本寫實主義短篇小說集。

四签名

《四個神秘的簽名》(英語:The Sign of the Four),英國小說家阿瑟·柯南·道爾於1890年所創作第二本以名偵探偵探歇洛克·福爾摩斯為主角的推理小說。

故事發生在1887年,講述了一個複雜的密謀,其中提到不列颠东印度公司的服役、印度民族起义、一個被竊的寶物以及由四位罪犯和兩位腐敗監獄看護所擬定的秘密協定。其中指出和人性化福爾摩斯的吸毒習慣,並介紹華生醫生的未來的妻子瑪麗·摩斯坦。

大卫·休谟

大衛·休谟(英語:David Hume,1711年5月7日-1776年8月25日)是蘇格蘭的哲學家、經濟學家和歷史學家,他是蘇格蘭啟蒙運動以及西方哲學歷史中最重要的人物之一。雖然現代對於休謨的著作研究聚焦於其哲學思想上,他最先是以歷史學家的身分成名。他所著的《英格蘭史》一書在當時成為英格蘭歷史學界的基礎著作長達60至70年。

歷史學家們一般將休謨的哲學歸類為徹底的懷疑主義,但一些人主張倫理自然主義也是休謨的中心思想之一。研究休謨的學者經常分為那些強調懷疑成分的(例如邏輯實證主義)、以及那些強調自然主義成分的人。

休謨的哲學受到經驗主義者約翰·洛克和喬治·貝克萊的深刻影響,也受到一些法國作家的影響,他也吸收了各種英格蘭知識分子如艾薩克·牛頓、法蘭西斯·哈奇森、亞當·斯密等人的理論。

散文埃達

《史洛里埃達》(冰岛语: Snorra Edda)或稱《散文埃達》或《新埃達》是冰島詩人史洛里·斯圖拉松於13世紀寫定的無韻體散文神話故事和英雄傳奇。成書時間大約為1220年左右。

《散文埃達》的首篇是《欺騙古魯菲》(Gylfaginning),藉由古魯菲向三位神秘人物詢問關於北歐的神話。文中描述阿薩神族是來自亞洲的部族,奧丁是為部族領袖。之後奧丁不斷擴張領土,並將新疆土交由兒子統治,最後抵達挪威地區。由於史洛里是基督教的忠誠信徒,他不認為以奧丁為首的這些北歐諸神是「神」,因此在他的作品中,皆將其「人格化」。對史洛里來說,這些神話故事的內容並不是他書中的重點;詩歌的承傳和寫作技巧才是重要的。

木偶奇遇记

《木偶奇遇记》(英語:The Adventures of Pinocchio,義大利語:Le avventure di Pinocchio)是1880年卡洛·科洛迪在意大利出版的作品,被認爲是兒童古典文學經典之一,曾拍成电影逾二十次。

故事主角皮諾丘(Pinocchio)的名字是由兩个意大利文名詞pino(松树)和occhio(眼睛)所組成的,這個組合字在意大利西部托斯卡納地區之佛羅倫斯方言中的意思為松果。

本初子午線

本初子午線(英語:Prime meridian),即0度經線,亦稱格林威治子午線或本初經線,是經過英國格林尼治天文台的一條經線(亦稱子午線)。本初子午線的東西兩邊分別定為東經和西經,於180度相遇。

不像緯度起點(即赤道)可由地球自轉軸決定,理論上任何一條經線均可定為本初子午線,故此在歷史上曾對此線有不同定位。1851年御用天文學家艾里(Sir George Airy)在格林威治天文台設置中星儀,並以此確定格林威治子午線。因為當時超過三分之二的船隻已使用該線為參考子午線,在1884年於美國華盛頓特區舉行的國際子午線會議上正式定之為經度的起點。來自25個國家共41位代表參與了會議,但法國代表在投票時棄權,在1911年之前法國仍以巴黎子午線做為經度起點。

從北極開始,本初子午線經過英國、法國、西班牙、阿爾及利亞、馬利、布吉納法索、多哥和迦納共8個國家,然後直至南極。

除了定義經度,格林尼治子午線亦曾作為世界時間標準使用。理論上來說,格林尼治標準時間的正午是指當太陽橫穿格林尼治子午線時的時間。然而因為地球自轉速度並不規則,現在的世界標準時間基準已由協調世界時取代。

格林兄弟

格林兄弟(德語:Brüder Grimm或Die Gebrüder Grimm)是指雅各布·格林(1785年1月4日-1863年9月20日)和威廉·格林(1786年2月24日-1859年12月16日)兄弟两人,他们是德国19世纪著名的童话搜集家、语言文化研究者。两人因兴趣相近,经历相似,合作研究语言学、搜集和整理民间童话与传说,故称“格林兄弟”。

格林兄弟的许多作品流传甚广,如《白雪公主》、《睡美人》、《長髮姑娘》、《灰姑娘》、《糖果屋》、《名字古怪的小矮人儿》和《青蛙王子》等故事。

植树节

植树节,是一些国家为激发人们爱林、造林的感情,促进国土绿化,保护人类赖以生存的生态环境,通过立法确定的节日。

欲经

《欲经》(梵語:कामसूत्र pronunciation, Kāmasūtra) 是古印度一本关于性爱的经典书籍,相传是由一位独身的学者伐蹉衍那所作,时间大概在1世纪和6世纪之间,很可能在印度文艺复兴的笈多王朝时期。

比利小英雄

《比利小英雄》(丹麥語:Pelle Erobreren, 瑞典語:Pelle erövraren) 是丹麥導演比利·奧古斯特於1987年的電影作品,電影講述一對從瑞典移民到丹麥的父子的故事。本片在各方評論大獲好評,並獲得第41屆坎城影展最高榮譽金棕櫚獎、金球獎最佳外語片與奧斯卡最佳外語片獎。

看得见风景的房间

《看得见风景的房间》(A Room with a View)是英国作家爱德华·摩根·福斯特于1908年发表的一部小说,描写一位生活在英格兰年轻女子露西。故事发生在意大利和英格兰两地,福斯特在作品中比较了意大利和英格兰的差异:意大利相对自由,允许自然的激情,与压抑虚伪的英格兰社会形成对照。在意大利旅行期间,露西的世界观发生了戏剧性的改变。这既是一部爱情小说,同时也是对20世纪初英国社会的批评。

1985年根据该书改编为电影《看得见风景的房间》。

科學怪人

《科學怪人》(英語:Frankenstein; or, The Modern Prometheus),又名《科學怪人:另一個普羅米修斯》,又译作《弗兰肯斯坦》(Frankenstein),是西方文学中的第一部科学幻想小说,诞生于日内瓦湖畔,出自玛丽·雪莱之手。最初出版於1818年,較為普及的版本是1831年印行的第三版,屬於受到浪漫主義影響的哥特小说。後世有部份學者認為這部小說可視為恐怖小說或科幻小說的始祖;不過,目前已知1764年出版的《奧特蘭托堡》(The Castle of Otranto)方為第一部哥特小說或恐怖小說。弗兰肯斯坦是故事中的瘋狂醫生,因為以科學的方式使死屍復活,所以中文版译作《科學怪人》。而那个人造人稱為「弗兰肯斯坦的怪物」。

純真年代 (小說)

《純真年代》(英語:The Age of Innocence)是伊迪絲·華頓的第十二本小說,最初在1920年的《Pictorial Review》雜誌上分四部分連載,後來由D. Appleton & Company以書本形式在紐約和倫敦發行。本書贏得了1921年普利策小说奖,使得華頓成為第一個獲得該獎的女人。儘管委員會最初同意將該獎項授予辛克萊·路易斯,但由於政治上的理由,評判駁回了他的小說《Main Street》,並且「確立華頓為美國第一夫人文學家」,其諷刺的是委員會授予《純真年代》獎項的理由是否定華頓自己露骨和隱約的諷刺,這使本書如此值得關注。本書故事是設定在鍍金時代期間,1870年代的紐約市上層階級。在華頓與出版商為她的作品吵架並成為一名成功的作家後,於50歲時寫了這本著作。

约瑟夫·傅里叶

让·巴普蒂斯·约瑟夫·傅里叶男爵(法語:Jean Baptiste Joseph Fourier,1768年3月21日-1830年5月16日),法国数学家、物理学家,提出傅里叶级数,并将其应用于热传导理论與振動理論,傅里叶变换也以他命名。他被歸功為溫室效應的發現者。

维基文库

维基文库(英語:Wikisource)是维基媒体基金会旗下维基百科的姊妹计划,目的是创建一个自由的、基于Wiki的文献仓库,包括每一个语言版本的完整原始文献,并且把這些文献翻译成多种語言。刚开始叫做「Sourceberg」,在2003年12月6日经过投票确定为现在的名称。

现在维基文库上主要存放各种遵循GNU自由文档协议证书的文档以及兼容这个协议的原始文档,还有公有领域、无版权或者版权已经过期的原始文献,例如古代的诗歌、文章、法律文本等等。

这个项目在2003年11月4日开始启动。它的图标是一座寫實的冰山。但由於圖像版權問題,後又經投票,決定今日的圖像。

由于美国对较短期限规则的不接受性,部分内容无法放入维基文库。

阿尔冈昆语族

阿冈昆语族(Algonquian languages)是美洲原住民语言的一支,阿尔吉克语系下最主要的一个语族。它是阿尔冈昆人所操的语言,使用者从北美洲东岸一直延伸到落基山脉。语族下不少语言处于濒危,有一些已经消亡。

黑色鬱金香

《黑色郁金香》(法語:La Tulipe noire)是大仲马所写的一本历史小说。

格式
阅读
编辑
来源
活躍
停產

其他语言

This page is based on a Wikipedia article written by authors (here).
Text is available under the CC BY-SA 3.0 license; additional terms may apply.
Images, videos and audio are available under their respective licenses.