标签和搜索

标签(tag)的历史远比互联网,甚至比计算机都要悠久得多得多,刚有畜牧业的时候古人就知道在牲口身上打tag了。在Web 2.0时代,标签的含义并没有多大的变化,还是很实在的标签的意思。不过对于这个古老的事物,似乎还是有很多人不大习惯,不知道该怎样最大限度发挥标签的作用。

虽然在技术层面上,互联网与tag密不可分 — HTML就是一种基于标签的语言。但是在应用层面上,标签进入用户视线的时间不算太长。打个比方,在电子邮件系统中,对邮件进行分类的方式一直是用folder(文件夹)。这是从本地计算机文件管理中沿袭下来的机制。不可否认这是一种非常直观易用的方式,也不需要任何的学习成本 — 电脑上的本地文件就是使用这种方式管理的。几乎所有的电子邮件系统都使用这种方式,所以Gmail用户提出“So When Do We Get Folders in Gmail?”这种问题也不算太奇怪。

Gmail在流行的电邮系统中率先引入了标签概念,当然它不叫tag而叫label,同义词。这个label实际上是可以当folder用的,而且我相信绝大部分Gmail用户都在把label当folder用 — 其实我也是。

实际上这是错误的用法,标签不应该当文件夹用。否则直接用文件夹就行了,多余地搞个标签系统出来干什么呢?

首先要搞清楚标签和文件夹的区别在什么地方,最直观的区别就是一条信息只能在一个文件夹里,而同样一条信息可以打上很多个标签。没错,但这是只是表面上的区别。有很多人都会问:打那么多个标签干什么?太乱了,标签一多我自己都找不到东西了。

说得很对,标签多了,我们一眼看去确实乱七八糟,但标签和文件夹的本质区别就在这里 — 文件夹是给我们自己看的,而标签不是给我们看的,它实在是给搜索引擎看的。所以,标签和文件夹尽管能以非常相似的方式使用,但在骨子里是完全不同的两个系统。

如果排除直接用内文关键字搜索信息这种无视管理方式的做法,在这种两种系统中寻找信息的流程分别为:

  • 在文件夹系统中寻找信息的方式:肉眼寻找相关文件夹 –> 打开文件夹 –> 在文件夹内肉眼寻找信息

  • 在标签系统中寻找信息的方式:输入相关标签搜索 –> 在结果中肉眼寻找信息

这两个流程并无优劣之分,只是各有适应范畴。如果信息的类别稀少,条理鲜明,总数也不多,使用文件夹方式当然效率很高;但如果信息类别庞杂,条理混乱,而且还是海量,那标签系统恐怕会远远胜出。

在电子邮件系统中,其实两者都可用,因为大部分电邮用户的邮件分类都不会太多,使用内文搜索也基本可以替代标签搜索。标签系统在别的应用中会取得较明显的效果。打个比方,网络书签和网摘,就不应该使用文件夹系统,因为对这两种应用而言,大部分用户收藏的信息符合“类别庞杂,条理混乱,数量众多”这个条件。如果让我用文件夹管理Delicious里面的信息,估计我会疯掉的。

在网摘服务中,Evernote已经率先摈弃了文件夹,完全转成标签+搜索的形式,这无疑是一种进步。可惜其搜索还不完善有待改进。国产佳软网文快捕则依然沿用文件夹形式。

最后说说文件夹系统和标签系统的一些使用心得。

文件夹系统,由于一般使用肉眼寻找信息,所以分类数和每个分类中的信息条数应当平衡,而且越少越好。应当把文件夹排列出清晰的次序,设计出高效的子分类树。

标签系统,由于大量依靠搜索寻找信息,所以给搜索引擎看的资料越详尽越好。标签不需要控制数量,每条信息的标签应尽可能多,杂乱的问题不需考虑,标签不是给人看的。但要注意的是,同义标签应尽量统一。

Comments