中国民办高校网

网易跟贴的前世今生

4,推荐系统

A计划:构建一个类似IMDB等电影分享网站之类的评价系统,而且计算公式复杂保密,其中包括发表时间,支持数,反对数,被引用回复次数(被盖楼数),甚至参与顶帖的用户身份,也加上权重计算。最后换算成一个叫“热度”之类的数字,进行排序。但是最后没有付诸行动,主要是担心在跟贴这样快速、简短的评论系统中,引入一个深度用户参与的复杂的评价系统,很担心效果。而且,如果用户无法理解自己行为与最终的排行的直接关系,会极大的降低参与兴趣。

B计划:放弃上面的复杂公式,只是在现有的顶帖基础上,增加时间衰减的计算。希望这样可以避免长期占位的发生。

C计划:构建用户积分系统,用户的积分来源于发帖被顶,而获得积分之后,则可以用于顶别人的贴来积分金钱。也就是说,将热帖的产生权,交给那些通过发帖而拥有大量积分的用户。

此外,还有其他一些零碎的想法。其中可能有的是错失的好机会,有的可能是明显的歧途。但是,盛名之下的痛苦在于,决策时,我都倾向于保守。因为在守成与冒险之间,大多数时候,选择了前者。

四,发帖数

1,点一下“支持”自动发一个贴?

互联网有句话叫“PV是万恶之首”,跟贴的总数,也成了各家表面比拼的一大手段。特别是在04、05年很长一段时间里,电视、报纸在引述一条新闻在互联网的反响时,经常采用在某某网有多少条跟贴。而这些记者可不管这个跟贴数字背后是怎么构成。

那时,新浪、搜狐(腾讯后来也加入)都采用了点一下“支持”或者“反对”,自动生成一个跟贴的方式,内容基本是“我顶”“很好”“支持”几个预设好的。这样跟贴的数字就如当年的亩产量一样,飞天上去了。

我们曾经为此多次开会,争论激烈。特别是在内容影响力和市场份额整体落后于对手的恶劣环境中,我们又在残酷对比的跟贴数上被对手抛离,真难抵挡住诱惑。最后还仅仅是因为一些朴素的想法(用户是否需要)而得以保身。

新浪等采用自动发帖的方式,带来非常严重的后果是,跟贴可读性急速下降,满页都是用户点击“支持”“反对”系统自动生成的跟贴。后来有的网站采用区别对待的方式,默认不显示自动生成的,最后甚至取消了。但是他们在比拼跟贴数字的时候,已经给网易跟贴让出了极好的发展机会。

2,合并跟贴

合并跟贴是指将相同题材的新闻跟贴合并起来,特别是制作专题的时候使用较多,比如,南非世界杯所有新闻的跟贴合并。这个功能的发明者应该是新浪,设计初衷估计一方面是增加跟贴数,网站在对外宣传时,号称某个话题网友评论数过百万条,是相当壮观的;另一方面可能真有部分用户有此需求。梅西的新闻跟贴都合并到一起,你只需要从任何一条梅西的新闻点进去,都可以看到所有的评论。

但合并跟贴对跟贴内容质量的伤害还是存在的,因为网友不少评论是针对当篇新闻的具体内容,合并后会导致错乱。比如一篇挺国足的新闻,跟贴可能全是骂作者的,如果被合并到另外一篇骂国足的新闻里,会让人莫名其妙。

网易曾经采用一个折中的方法(其他网站也看到有类似的),默认显示的是本新闻的跟贴,然后还有合并更贴的入口。而合并的页面里,每条跟贴都显示来源于哪篇新闻。但是大概在08年初的时候停了。当时主要是对系统性能的影响有点大,而为了一个用户并不太需要的功能,不值得。2010年初又恢复为专题的跟贴合并,这有一定的合理性,除了前面说的数字以外,还有专题本身就是一个话题的集中,所以跟贴也因此集合。

五,IP识别和网易火星网友

1,IP识别功能

IP自动识别就是将跟贴用户的IP信息,自动转换成地理信息。这个功能推出之前的跟贴,用户身份要么是可以自己填写(包括可能登录),要么就直接使用IP了。常见的格式就是“IP:202.120.100.* 网友”。

07年初,网易上线了自动将IP匹配成地理信息的功能,表述格式变为“网易北京海淀网友(202.120.*.*)”。IP隐藏了最后两位。

这个功能的灵感来源于一篇谈用户体验的文章(不过我实在想不来是谁写的、实在抱歉),里面大概有一句话,意思是要将用户不能识别的机器信息,转换成可辨认的文字或者图形。后来有一天看跟贴的IP时,就突然灵感一闪,换成大家可识别的地理信息如何?

于是在网上找了个IP地址库,总共有10几万条记录(IP段和对应的地址)。但是中文地址不规范,很多详细到“某某街道几号XX网吧”,所以就干脆人工整理,将多余的信息全部删掉,最详细只保留县区级、或者学校。但也保留了微软中国公司和IBM中国公司的IP信息,这导致后来出现了“网易IBM中国网友”,真有点对不起发帖的兄弟。这个笨办法耗费了1个月的时间。后来的版本采用了程序智能截取,并且自动升级IP地址库信息。

这个功能推出一年后其他大网站都纷纷效仿。不知道是不是网易最早在跟贴上应用的,但是当时的确没有参考过其他网站,因为日常浏览的网站里,没看到过。

2,网易火星网友

在整理上面说的IP地址库时,偶尔遇到一些没有地理位置的或者只显示“ICCAN未分配”的IP段,犯困了。一开始准备老老实实地用“网易IP未能识别网友”,后来干脆恶搞了个彩蛋,就是“网易火星网友”。

因为不能被识别而且网友使用到的IP其实不多(不包括地址匹配错误的),所以火星网友的出现概率极低,偶尔出现时引起大家骚动和仰慕。但是后来网友发现漏洞,利用HTTP头信息欺骗,捏造不存在的IP(包括局域网IP),就经常看到火星网友。甚至直接修改地域信息的显示。

3,地域攻击

IP识别功能所赢得的巨大声誉是在意料中的。但也导致了一些反对的声音(包括网友和网易内部),最强烈的就是地址信息所引起的地域攻击。甚至还被网友举报到监管部门(包括色贴),最后为了生存,对直接攻击的做了删减,并且在页面提醒“文明社会,从理性发贴开始。谢绝地域攻击。”

4,IP地址的应用

曾经设想中的应用,根据新闻的事发地,自动列出当地网友的跟贴。比如,在一篇“成都公车起火”的新闻后,来自“网易四川成都网友”的评论,可能是非常重要的新闻信息。但是由于这个功能大部分新闻不适用(体育、财经、科技等),以及在“所有辅助功能为系统性能让路”的原则下,一直搁置。