公众分类法（Folksonomy）

2023-12-08 07:17:40

先从一个具体的问题开始思考：如何给电子书分类？(这个问题可以推广到如何给信息分类。)

传统的方法是使用自上而下的目录分类法(Taxonomy)。在中国是中图分类法(第四版)，在美国是国会图书馆分类法。但是，这种分类过于复杂(所有细目厚达几千页)，导致实施起来成本很高。而且，它不太符合电子书的实际，一是分得太细，一本书往往在第四层或第五层的子目录；二是分得不均衡，中图分类法下A类是"马克思主义、列宁主义、毛泽东思想、邓小平理论"，I类是"文学"，显而易见，对于电子书库来说，将A类单独分为一类非常浪费，而I类则至少可以分列成"汉语文学"和"外语文学"两大类。

此外，目录分类法还有一个先天不足，就是有时候一本书到底分在哪一个类很不明确。比如，《18世纪英国诗歌选(中英对照)》到底应该是"语言"类书籍，还是"文学"类书籍？一个解决办法是同时分在这两类，但是这会造成巨大的冗余工作量。

总之，目录分类法对于巨量信息来说，不是理想的分类方法。但是，它的直观和方便，却是其他分类法难以比拟的。

随着互联网的发展，一种新的分类方法出现了，那就是公众分类法(Folksonomy)。典型的代表网站就是Del.icio.us。

所谓"公众分类法"，就是由公众来为信息贴加标签(tagging)，被使用最多的标签就最能说明这条信息的特点。

使用标签分类，非常的便捷，而且易于组合，但是也存在一些问题：

(1)不同的用户对相同的标签，往往有不同的理解，比如在"工具"标签下，可能会发现彼此完全没有关系的内容。

(2)同义词问题。用户可能使用同义词作为标签，比如"tv/television"，"Holland/Netherlands/Dutch"，"超级女生/超女"。英语中，还存在复数问题。

(3)词的多义性问题。比如"china"这个标签，到底指中国，还是指瓷器。

(4)用户的标签五花八门，可能会产生大量"噪音"，加重系统负担，降低分类的准确性。

所以，最好的解决方法应该是，自上而下的目录分类法与标签式的公众分类法相结合，然后对能够用作标签的词汇进行控制(controlled vocabulary)，不能什么词都用来当标签。

当然，这只是理想中的情况，技术上的实现似乎难度很大。

(注：此文用来为我整理思路，留待以后修改和补充。)

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > 中图分类法----C 社会科学总论
下一篇 > 中图分类法----I 文学

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

公众分类法（Folksonomy）

相关文章