(中国B2B研究中心讯)
在过去10多年中,“先发展,后立规矩”这一被行业主管部门和业界企业共同接受的“默契”曾经在客观结果上促进了中国互联网行业的高速发展,但同时也留下了一些后遗症。其中最为突出的后遗症就是中国互联网行业始终没有建立一个符合本地化行业特征的数据体系。随着行业发展的成熟度日益提高、相关技术的突破以及本地化第三方数据服务机构的诞生,中国互联网行业终于有望通过建立相对统一的本地化数据体系而进入一个新的发展阶段。
出人意料的巨头会议
2008年3月1日,北京刮着3、4级的偏北风,气温比前两日有所降低,但春天的气息却已经很明显了。两天后即将召开每年一度的“两会”,整个城市都已经进入了“两会”的预热准备阶段。在这样一种氛围下,中国互联网行业却发生了一件也许会被记入行业发展历史的重要事件。
在这一天,北京市互联网宣传管理办公室邀请国内互联网行业领军企业、行业协会负责人和业界专家在京举行了一个名为“共建行业数据标准 共筑中国数据体系”的专题活动。
“真没想到会来这么多‘大脑袋’,”一位参加活动的媒体记者惊叹说,“更没想到三大门户的掌门人能够如此一致地支持同一件事。”这位媒体记者的“惊叹”的确不是少见多怪,因为自从三大门户的各自地位基本确立之后,国内互联网行业的公开活动中,就几乎没有出现过三大门户掌门人同时坐在一起的情况:新浪的曹国伟、搜狐的张朝阳倒是不时地在一些业界活动中亮相,但两家网站会很默契地避免出现二人在同一活动“遭遇”的情况,而网易的丁磊自南下广州之后就非常低调,很少出席业界公开活动。
同样让很多到会媒体记者和业界人士感到意外的是,三大门户掌门人以及腾讯、百度、雅虎中国、阿里巴巴等中国互联网行业领军企业的高层人士共同聚首所讨论的话题竟然是一个看似没有太多新意的“老大难问题”:行业数据标准和数据体系。在过去几年中,互联网业界不时响起建立有关数据标准和数据体系的呼声,但却很少进入实操阶段。久而久之,业界人士对这个问题似乎已经产生了“听觉疲劳”。
“他们(三大门户掌门人)真的会参加这个活动吗?”这是活动主办方和协办方在向业界人士发出活动邀请后被问及最多的一个问题。而结果是,业界巨头们不但来了,而且还非常罕见地达成了一致。
究竟发生了什么质变
在3月1日的活动上,新浪、搜狐、网易三大门户的掌门人和众多互联网行业的巨头对于共同建立中国互联网行业本地化的行业数据标准和数据体系达成了空前的一致,到会的近200名业界人士在一份相关倡议书上共同签字。这种国内互联网行业近年来罕见的“一致性”令人不得不问这样一个问题:究竟发生了什么样的质变?
中国互联网行业10多年来的高速发展除了得益于IT技术的飞跃外,更应归功于中国改革开放的大背景。1996年中国互联网行业商业化发展尚处于萌芽阶段时,中国的改革开放已经经历了18个年头,市场经济体系和与这一体系基本适应的各种配套机制与体制已经初步建立,这为中国互联网行业的发展创造了良好的物质基础和外部环境。
无论是对于互联网企业本身的管理,还是对类似网络广告、网上交易、电子支付等与互联网行业发展息息相关的周边行业管理,相关主管部门从一开始就以一种开放和自信的心态确立了“首先鼓励发展,逐步进行规范”的基本原则。正是得益于这样一种宽松、开明的政策环境,中国互联网行业在12年间迅速成为全球第二大区域市场。
而在另一方面,在中国互联网行业的商业化发展经历了初创阶段,逐步进入成熟期后,规范化的问题开始日益凸显。行业管理准则(各种法律、法规)和行业标准是任何一个行业健康发展的必要基础。近年来,针对互联网行业的管理准则不断得到完善,但相关行业标准的建立却始终没有实质性的进展:业界始终未能就如何评估一个网站的运营状况以及商业价值、媒体投放价值达成一致。之所以会出现这种情况的原因是多方面的,其中有一个原因却一直被多数业界人士所忽视,那就是技术手段和实现方法方面的长期缺失。一位国内互联网业界元老曾经精辟地总结说:“互联网行业发展的底层动因是技术创新,任何网络功能的实现归根到底都取决于技术。”这句话同样适用于互联网行业标准和标准体系的建立过程。
业界专家指出,互联网行业完整的数据标准体系应由行业数据、垂直细分领域数据、企业数据以及用户数据等基本要素构成,相关数据的获取方式和手段也应多样化(普查方式与抽样方式结合,线上与线下结合),并能够形成交叉验证与相互补充。而国内互联网行业的现状则是,行业宏观数据采集、分析和研究方面在CNNIC等机构的努力下已经具备了一定的基础和权威性,但在垂直细分行业数据和企业级微观细节数据和用户数据方面却存在大量的空白。同时,数据采集的技术方法方面更是严重滞后。
在这种背景之下,一些海外机构推出的行业标准被引入中国互联网行业,并快速地被国内互联网业界以及上下游行业采用,其中最著名的就是Alexa网站排名。令人始料未及的是,Alexa网站排名在短短几年间竟然成了中国互联网行业的一个“主流标准”。尤其是在中国互联网行业度过了2000年—2002年间的“资本寒冬”、再度一片春色盎然之后,新网站为了获得VC的青睐、老网站为了打动广告主和广告公司的芳心,都不约而同地拿自己在Alexa的排名来说事,一时间,国内网站出现了唯Alexa马首是瞻的现象。同时,为了拉高自己在Alexa的排名,部分网站开始在内容建设方面“打擦边球”,更有甚者则借助各种作弊手段弄虚作假。时至今日,仍有一些打着“网站流量优化”、“Alexa排名优化”旗号的公司在专门为客户提供Alexa作弊服务。
另一方面,由于Alexa经常进行算法调整,导致国内众多网站在Alexa的排名如同过山车一样忽上忽下,并由此引发了国内互联网业界的混乱局面:某家原本排名前200名的网站突然在一夜之间排到了10万名之后,这样的情况时有发生;大到门户网站,小到垂直网站甚至个人网站,围绕自己与竞争对手在Alexa排名中的座次变化问题引发的口水战更是频频发生。
伴随着国内互联网行业由于Alexa带来的持续混乱,国内业界人士开始对Alexa提出各种质疑,除了对其采样方式和算法本身的技术性质疑外,更有人士尖锐地指出了Alexa的“越位”问题:Alexa通过完全随意的抽样方式所得出的“粗线条数据”既不能作为严谨的行业数据使用,更不适合作为衡量网站的微观细节数据使用。
在饱尝Alexa乱局苦果的同时,越来越多的国内互联网业界人士和行业主管部门开始把最终解决这一问题的希望寄托在本地化数据标准和数据体系的建立之上。正是这种共同意愿促成了3月1日业界巨头得以达成一致。
“网络普查”技术实现突破
近年来,一些业内人士和机构一直致力于为中国互联网企业提供各种数据和研究服务,并取得了一定的成就。但在针对大型网站、海量数据进行全样本数据采集、存储和计算方面却始终未能实现突破,这就如同仅进行抽样调查而不进行人口普查无法真正获得一个国家人口特征情况的道理一样。“不解决这方面的技术瓶颈,行业数据标准和数据体系将无法最终建立,”一位参加3月1日活动的业界人士一针见血地指出,“这也是以往虽然也有业界人士提出建立标准、体系问题,但最终无法真正实现的根本原因。”
不过,令这位业界人士感到欣慰的是,在3月1日的活动中一家本地化的技术企业推出了一个可以支持海量数据 “网络普查”的核心技术和服务平台。
作为3月1日主题活动的协办方代表,北京缔元信互联网数据技术有限公司CEO秦雯详细介绍了该公司自主研发的万瑞数据平台和万瑞数据指标体系。据悉,万瑞数据平台目前已经为新浪、搜狐、网易、央视国际、中华网、Tom网、酷6、优酷、奇虎、和讯、硅谷动力等近30家大中型门户网站、视频类网站、社区类网站、行业网站和6000多家中小网站提供7*24小时的全样本流量统计服务。“通过30多个数据指标,万瑞数据可以全面反映一个网站的浏览量、用户规模、用户行为特征、用户忠诚度和用户关注的内容等方面的情况。”
以在网站页面嵌入监测代码的方式获取全样本数据被认为是迄今为止最有效的网站数据采集和处理方式,一些海外机构自2004年开始向部分中国网站推出此类服务。但网站流量的细节数据不仅是企业的商业机密,同时也是关系到国家信息安全的基础数据。因此,主管部门一直希望能有本地化企业和机构能够运用类似的技术手段提供有关服务。从这个意义上说,万瑞数据是生逢其时。
在3月1日的活动中,新浪、搜狐、网易三大门户的掌门人曹国伟、张朝阳和丁磊均对万瑞数据平台给予了高度的评价,并表示将长期支持包括万瑞数据在内的本地化第三方数据机构。到会的众多其他网站高层负责人也对万瑞数据服务表示出浓厚的兴趣。
秦雯表示,万瑞数据希望能够填补国内互联网行业全样本数据领域的空白,并与主管部门、行业协会、业界企业、研究机构以及其它专业公司一起,共同建立中国互联网本地化数据体系。
官督商办的新尝试
针对3月1日活动的情况以及活动期间签署的倡议书,一些业界分析人士认为,中国互联网行业本地化标准和体系的建立工作有望取得实质性的进展。
“业界企业的普遍共识、迫切需求和主管部门的大力支持是两个缺一不可的基础,”分析人士指出,“而以万瑞数据为代表的拥有核心技术的本地化第三方数据服务机构的诞生和壮大则为这一过程提供必要的技术保障和信用保障。”
此外,业界对于主管部门以“官督商办”模式推动这一过程也给予了高度评价。国务院新闻办、尤其是北京市互联网宣传管理办公室在管理互联网信息内容方面从一开始就采取了开放和自信的态度,在日常管理中注重与业界企业的全面深入沟通,避免生硬的行政命令式管理。从近10年来中国互联网行业的发展情况看,这一管理模式是非常成功和有效的:互联网行业没有进入很多传统行业管理过程中“一管就死,一放就乱”的循环怪圈之中,而是在总体上获得了快速而有序的发展。
“互联网行业本身的技术特点和高速的发展速度、创新速度,决定了这一行业的标准和数据体系将很难像传统行业那样通过相对静态的条文来实现,”一位业界分析人士指出,“互联网行业的标准和数据体系将与技术和服务密不可分。因此,由主管部门牵头、监督,让有关各方共同参与,最终由具有技术实力的本土化第三方机构来提供日常服务。这将是一种具有积极和进步意义的新尝试。”