您现在的位置: 百道研究
数字化浪潮袭来,出版业的未来在哪里,谁能拯救传统出版业,这些问题日益受到关注。有产业观察家提出了“是元数据而不是电子书能够拯救出版业”的观点。为了开发潜在读者,为了让爱看书的人买更多的书,要做到让读者能在各种载体和场所发现自己喜欢的图书。由此,页数、故事发生的时间、分类、写作风格等元数据变得非常重要。出版时间不准确、作者张冠李戴等种种元数据的缺陷,更是导致谷歌图书搜索项目备受责难。元数据的质量和丰富性,以及人们对它的理解,将决定出版社是否能够成功销售图书产品。所有图书出版人士都会发现,理解元数据、掌握元数据,将变得越来越重要。
电子书并不是一种新的图书销售方式,在为数不多的、经年销售的几种版本的图书中,它不过是一个新版本形式。只有提供给读者喜欢的书,才能让读者高兴。 元数据为王。因为元数据太重要了,所以我要重复一下:元数据为王。
我不用再拿出大量文章和数据,证明图书出版业状态不良,陷入崩溃恐慌之中了。图书销售收入在下滑,直到最近(也就过去一两年),很多出版社都不知道如何应对电子书挑战(很多出版社连一个电子书出版战略都没有)。电子书不会拯救出版业,理由是:电子书是完全不同的一个图书形式。电子书不会让阅读产生革命化的变化,也不会改变图书内容。我在网上见过一些社会化阅读的项目,但这些项目都还处于尝试性的公测阶段,我可不敢说读者以后会愿意接受全新的阅读方式。
…………
电子书为什么不能拯救出版业? 电子书是一种版本形式,就像精装本和平装本。因为版本形式不同,所以它们的价格也不相同。一种产品以不同以往的价格为消费者接受,说明打开了新市场,
…………
如何挖掘图书消费潜力? 很简单,提供他们需要的产品,并且提供量要多于以往。怎么做到这一点呢?靠元数据。懂技术的人,喜欢元数据。他们吞食元数据,从来没够,围绕元数据,他们大做文章。实际上,在音乐文件元数据上可以做事情而言,潘多拉盒子是一个绝妙的比喻。但是,对于潘多拉盒子的比喻来说,音乐文件的元数据还不够丰富,元数据搜集工具也不够完善(元数据编制需要手工进行),这是一个限制性的因素。元数据为什么那么值钱?咱们从一件小事说起。
…………
有人注意到,谷歌图书项目中存在只有谷歌一地才有的信息错误,特别是出版时间。其他错误包括作者张冠李戴——西格蒙德•弗洛伊德被列为一本关于早期网络浏览器Mosaic的书的作者之一,而亨利•詹姆斯则成了《包法利夫人》的作者。更让人大惑不解的是,很多图书出现了主题分类错误。
谷歌图书项目是谷歌这个顶尖技术公司制定的野心勃勃的计划,它的目标是“将世界上所有图书进行数字化扫描”,让所有图书都能通过网络或者在图书馆进行搜索。人们对这个项目看法不一,有人认为这是一个精彩绝伦的、乌托邦式的理想,有人认为这是史无前例的图书版权大掠夺。作家协会和美国出版商协会针对谷歌公司的集体诉讼,其结果就是谷歌图书搜索和解协议——这个协议如此难以理解,以至于敢声称看懂了的,必定是能够理解狭义相对论的少数人。
但是所有人好像都不否认,谷歌图书搜索项目对于学术研究来说意味着革命性的进步,对那些从事专门研究却没有条件到大学图书馆查阅资料的人来说,更是如此。但情况果真如此吗?加州大学伯克利分校的教授杰弗里•努恩伯格在去年《高等教育年鉴》的一篇文章中指出,研究型图书馆资料丰富固然重要,同样重要的是查询这些资料的工具。而谷歌图书项目中,大量数字文本的图书情报信息,存在严重的问题。
………………..
元数据不充分,特别是对于读者来说,这是一个严重的问题。这个话题以前提到过。因此我打电话采访了努恩伯格,询问谷歌图书的元数据,对历史学家以及其他学者来说,到底存在多严重问题。
问:什么是元数据?
答:元数据是关于一个文本或者作品的数据。在古老的卡片检索中,一张图书信息卡,就是一个元数据,上面列有书名、作者、出版社、出版时间、页码数量等等。将来,元数据中还可以包括各类其他信息,比如读者阅读该书的情况,或者销售册数等。
面对品种数量大的图书——不管是研究型图书馆还是巴诺书店——元数据是大有用场的。比如查找一本关于羚羊或者鸟类的儿童书,读者可以先走到儿童书专区,在这个专区里找“自然类”。相似地,如果读者想买一本安东尼•特罗洛普的小说,那么也要首先在元数据中进行查找,一般要到虚构类或者文学类中,根据作者姓名拼写的字母顺序,查找相关图书。
问:这么说,书店里图书摆放和书架分类都是一种形式的元数据,因为它提供了图书的分类信息?
……………
因为假如谷歌图书项目真的是一个“终极图书馆”,没有人会重头再来一遍了,我觉得大家伙也是这么想的,那么把事情做正确,就变得十分重要了。当然,这样做会花很多钱。为了获得很少一点内容,要把不成比例的资源投入进去。但这就是研究型图书馆工作的关键所在,也是学术研究的本性使然。
做好了元数据,出版社受益无穷。因为元数据实际上就是“关于图书的信息”,这个领域里的发挥空间相当大。与每一种图书相联系的质量、偏好、相关图书,都可以做成元数据,没有止境。
Giant Chair的新任首席执行官乔•埃斯波西托说,元数据是出版业未来的钥匙;他将元数据比作平装本,认为元数据的重要性,不亚于当年艾伦•雷恩发现廉价平装本在大众商品销售渠道销售,可提高图书销售。
当然,Giant Chair是一家利用元数据,帮助出版社营销的公司。 还有不少讨论,想知道出版社在未来起什么样的作用、扮演什么样的角色,在未来的出版大变局中,是否还需要区分出作者和出版社两种角色。有一个观察家指出,版税率上将存在细微差别:批零模式和代理制模式,不管委托费是交给版权代理,还是不从出版收入中扣除,版税收入是不一样的,出版社在争取作者的竞争中应采取不同的策略。这就导致下面这个问题:出版社之间的差别难道就是版税率吗?只有版税率上的差别,好像各出版社的图书销售量都是一样似的。这就导致以下这点:元数据的质量和丰富性,以及人们对它的理解,将决定出版社是否能够成功销售图书产品。
……………
做好了元数据,出版社受益无穷。因为元数据实际上就是“关于图书的信息”,这个领域里的发挥空间相当大。与每一种图书相联系的质量、偏好、相关图书,都可以做成元数据,没有止境。
……………
我曾经指出过,我们现在正朝着半数新书销售都将通过网络实现这个方向上走。所有在线销售的图书,都高度依赖元数据。详尽、准确的元数据能让作品和作者更容易被发现。不准确的元数据,将导致一本书在网上为人忽略,即使搜索相关信息的人,非常清楚自己想要的东西是什么,但元数据错了,图书信息就根本不能呈现在读者面前。当然,元数据光做到准确是不够的,还要丰富。 元数据,它是什么,它如何影响图书销售,所有图书出版人士都会发现,理解元数据、掌握元数据,将变得越来越重要。
从计算机介入书业后,元数据问题就开始更严峻了,至少在中国书业纠结了二十多年了。本人几乎全程承受了元数据所带来的“苦难”。我们体制问题导致短期行为严重,管理问题导致数据水平低下。有识之士不少,可惜这么多年奔走呼号没什么用。总署领导多次呼吁,又有多大效果呢?
元数据的问题不从出版社源头上解决,终究是没有出路的。出版社如果不认识到元数据是管理自己内容资产的重要要素的话,自己不做好自己的事,别人很难有所作为。一条元数据成本在出版社生产大概二十元,全年大社4万多元成本;全行业全年20万种,400万元;但现在各单位自己做数据,有人估算全行业1亿元成本左右,还做不好,做好了也不统一。现在很多出版社倒不在乎这几万元钱了,但是内容的标准化与超前性,又比较忽略,倒头来还会补课的。
我曾在中文在线参与数字资产平台的研发。这是一个对图书原始文本、版权期限及版权类型、销售文本、元数据进行动态管理的平台。研发及应用中,最纠结的部分就是元素据。像书名、定价、作者、出版日期、出版社等这些元数据很容易获得,但作者简介、内容简介、故事背景、关键词、非中图法分类、上架建议等更助于读者和营销人员了解内容品质的元数据很难获得。原因之一是很多出版社的电子书目里没有这些元素,此外,在传统的图书信息传递模式中,图书信息在书店采购环节、版权代理机构的版权采集环节,总是急剧衰减。跟内容相关的元数据缺失,带来的问题就是:营销人员不知道哪本书会畅销,哪些书可参与特定主题的营销活动,哪些书可针对某一类人群推广。这个问题在电子书、手机书的销售中,就更加突出了——这些元数据决定了读者是否点击、下载!为了更好地实现销售,出版机构不得不谨慎面对元数据经营这个命题!
发表评论?[请登录]
北京百道世纪网络信息技术有限公司及其平行公司北京百道世纪教育科技有限公司下属的网络媒体平台百道网、百道网微信、帮书店微信,以及百道学习APP和小程序等平台上发布的文章,版权属于北京百道世纪网络信息技术有限公司所有,或北京百道世纪网络信息技术有限公司与著作权人共同拥有,严禁转载。任何纸媒、网媒或社交媒体需要发布或转载,请与版权专员联系(service@bookdao.biz),获得授权后,方可转载。对于任何未经授权的转载,我们将依法追究其侵权责任。
扫描二维码 分享文章