2008年10月29日 星期三

参加2008中文网志年会

难得今年在我所在的城市举办而且又是周末,我实在找不到什么借口能够说服自己不参加了,遗憾的是15日我要参加NOIP复赛就无法出席了,预定16日将会参加,希望借这个机会能够和各位Blogger以及本Blog的读者见一下面。因此邀请您在当日与我共进午餐,有意者请与我联系。

2008年7月18日 星期五

关于在线储存应用的一些随想

最近由于我的一些需求,我尝试了不少的在线储存服务,也因此有了一些关于在线储存的想法。简单地说我认为目前的在线储存服务大都被当作一个简单的文件寄存箱,而大部分的这类应用自身的定位(网络硬盘)也确实如此,这让我感到十分惋惜,个人认为这一应用的可扩展性非常之高,因此本文记录的更多的是我的一些随想。

不过更让我郁闷的是,即便是最基本的文件储存应用都没有多少在线储存服务能够满足我的要求。我对文件储存服务的评价很简单,下载/上传速度、稳定性、保存期限、空间(包括单个文件大小限制)、分享的便利性和效率以及文件管理的效果。

基本上第一个条件就将大部分的国外在线储存服务淘汰了,而硕果仅存的几个国外在线储存服务又因为剩下的各个条件而一个接一个地被淘汰了。其中我比较满意的是SkyDrive,其让我感到略显不足之处是空间和分享便利性和效率这两个条件,其中后者是造成我放弃其的关键原因。虽然我非常崇尚简洁,但简洁的基础应该是高效,SkyDrive上传文件只能通过上传页面而且不具备上传进度查阅、断点续传和多任务管理功能,这使其无法胜任大规模的文件寄存需求。

而国内的在线储存服务的选择就更少了,不过所幸几乎是唯一的选择中存在一款虽然尚有欠缺,但基本能满足我的需求的服务--纳米盘(仅就我的需求而言,无意为其做宣传)。因为我寄存的文件需要长期储存,因此无法提供永久储存服务的都被我排除在外了。纳米盘提供的单个账户1G的永久储存空间和单个文件300MB的限制基本能满足我的这一需求,稳定性就其到目前为止的表现而言尚属可以接受(尽管有少数文件会出现无法正常连接的情况)。而让我最终选择纳米盘的原因正是我刚才提到的放弃SkyDrive的原因,纳米盘提供了一个能够让我高效管理多账户上传的客户端。尽管我对纳米推广其客户端的方式颇为不满(对大文件强制要求使用客户端下载),但其客户端基本符合我的简洁定义,功能也能够满足我的基本需求。此外纳米盘对于已经上传过的文件能够自动识别避免重复上传,这一点对于节省时间和其磁盘空间占用非常有效。这就是我最终选择纳米盘的原因。

让我感到非常不解的是我认为我的这些要求都是非常合理而不苛刻的要求,甚至可以说是最基本的要求,但国内能够勉强满足的却只有纳米盘(或者还有我不知道的,欢迎推荐)。而国外的服务由于地理位置的因素基本无法与之竞争,这简直像是在拱手让出一个可以垄断这一需求的机会……但单纯的文件储存在我看来价值已经越来越少了,分享文件的需求早已被P2P应用占据了不少的市场,而储存文件的需求由于硬盘价格的降低也越来越低,因此在线储存应用应该寻求新的需求和价值。

其中的一个方向目前已经有此类应用的服务商在尝试了,简单地说就是在文件储存的基础上融入在线使用文件的应用,也就是加入Web Apps模块。比如Box.net对于一些特定的文件(如:办公文档)能够提供在线的浏览工具而不需要下载到本地再利用本地的桌面客户端浏览。这不仅是起到了提高效率的作用,而且也是象征着一种未来的趋势。我一直坚信在线应用最终可以完全取代桌面应用,而如果能够将网站下载到桌面这一过程舍弃,那必将使用户对于在线文件储存服务的依赖度和归属感大大增加,也因为满足了更多用户的需求而使受众面大大增加。但和大多数的Web Apps的开发一样,其仍然受到许多限制,主要的阻碍就是提供服务的成本以及实现的技术难度的增加。

另一个方向我似乎仍没有见到哪个实例,简单地说就是以用户上传的文件作为入口,融入SNS元素,延伸出类社区应用。举个例子就是通过融入SNS元素来加强用户的分享行为。要实现这一点首先需要对用户上传的文件能够做到有效的甄别和分类,但依靠目前的技术要做到这一点非常困难,因此更多的应该依靠对用户的引导,使用户能够主动地完成这一过程。但似乎目前大多数的服务都没有进行这一引导,以纳米盘为例,其虽然具有Tag系统,但在客户端上传时其甚至没有提供给用户填写Tag的模块,只能在完成上传后在后台编辑,试问这样的Tag系统和形同虚设有什么区别。当然,要让用户主动完成这一过程仅仅靠引导是不够的,需要提供给用户足够的动机。

一个不难实现但我似乎没有看到有哪个服务去做的方法就是提供一个文件聚合系统。这个系统的基本功能应该包括公共文件搜索功能和相关文件显示功能,在用户认可了这一系统后引导用户提供更多的信息,理由是能够使这一系统更加准确和增加新的社会化功能模块。至于这一模块我认为除了能够实现前面提到的两个基本功能的准确度提升外,还应能够利用用户的共享文件历史来提供一个推荐系统。这一推荐系统不是用于推荐其它用户共享的其可能感兴趣的文件,而是向其介绍和其兴趣类似的用户,关注这些用户就可以得到其分享文件的活动提示。在此基础上可考虑通过与其他外部应用的合作来强化这种基于文件分享为入口的社会化关系,最终形成一个SNS社区,目的同样是增强用户对网站的黏度,引导新的需求使应用价值提高。

最后想发一下牢骚就是现在基本所有的在线储存应用(或者说目前阶段应该叫网络硬盘更加合适)都不提供公共文件搜索系统,而且对文件分享页面的设计非常不利于搜索引擎索引,空置着许多资源而不利用,对于用户和服务提供商都是一大遗憾。

2007年10月28日 星期日

精准广告投放系统

本周Facebook的精准广告投放系统Flyers Pro上线了,相比起以往我们概念中的精准广告,优比客对其的精确级别的评价是“激光制导”级别。只是我很疑惑,评定广告投放的精确级别的标准到底是什么?从Facebook的Flyers Pro这一例子来看,似乎其中一种标准是对用户定位的准确度和细分程度。但是这似乎并不完全符合精准广告投放的目的,精准广告投放之所以会出现是因为广告主需要缩小受众用户面,提高广告转换率,达到花费相同的广告成本创造更高的价值的目的。但是广告的转换率是随受众用户定位的精确程度递增的吗?我想毫无疑问在某个数值范围内这个关系是成立的,但这个关系并不在所有数值范围内成立。 此外,我很疑惑的是为何广告提供商能如此精确地定位自己的目标客户群体呢?一些较广泛的群体定位过滤(如:老年人对高新科技类产品的敏感程度不高)这并不难进行,但高新科技类产品的目标用户群体是青年人还是中年人,是有什么兴趣爱好的青年人/中年人较为敏感这些又如何能有效地获知呢?只是直观地将目标用户定位为兴趣爱好与产品类型相关的用户吗?广告转换率会因为定位的进一步精确而提高吗?对于这一点我很怀疑。

这也正是我不看好Facebook的这个所谓的“激光制导”级别的精准广告投放系统的原因,其对目标用户的定位的确可以达到一个细分程度极高的级别,但是这对于广告主而言真的是好事吗?在没有足够的数据和资料的前提下,我不认为广告主有能力准确地定位自己的目标用户群体。一个例子就是IT、互联网企业如果将目标用户定位为兴趣爱好是IT、互联网的用户,那广告转换率会比目标用户没有准确定位要高吗?我想未必。

原因是多方面的。我认为广告信息对用户的价值最大的情况是,用户对广告产品了解的信息不足但对其具有需求。而兴趣爱好与之有明显关系者很明显不符合这个要求。他们对广告产品的类别已经具备了一定程度上的信息的了解,因此广告信息对于其参考价值和可信度相比一般用户将进一步降低。如果将目标用户群体定位在他们身上,我想效果只会变差而不会变好。Faecbook提供了一个可精确定位目标用户的精准广告投放系统,但并不意味着相比其他的精准广告投放系统,广告的转换率会就此提高。

目标用户群体与其兴趣爱好之间并不具备一个清晰的关系,因此将目标用户进一步细化带来的结果未必是理想的结果。相反,保留一定的不确定性恰恰可以保证不因定位过于细化而流失潜在的大量客户。此外精确也是相对的,Facebook通过详尽的用户资料来达到精确的用户匹配效果,但是正如上文所述,这种模型的最大弊端恰恰是由于过滤条件过于精细,而无法有效地定制过滤规则以达到最好的目标用户定位效果。如果无法达到有效提高广告转换率的目的,那这个精确到“激光制导”级的精准广告投放系统又有何意义呢?

相较之Flyers Pro,由于缺失资料,Google AdSense的广告投放无法做到像Flyers Pro这样精确地定位目标用户。但正如我上文所述,由于缺少数据和资料,广告主使用Flyers Pro进行目标用户群体过滤条件设定时会有很大的困难,无法保证设置的条件可以达到较好的广告转换效果。此外Flyers Pro目前应用于Facebook的广告投放,如果将其拓展为Google AdSense这种网络广告中介商,那Flyers Pro恐怕将会因为隐私问题而受到极大的争议。

我想这也是为何在Yahoo!和Microsoft的广告投放系统都开始结合收集的用户资料,来作为广告匹配的其中一个参考因素。尝试通过这样来实现个性化的广告匹配,也就是某种意义上的精确广告投放了。但和我不看到Flyers Pro的理由类似,我同样不认为这种处理初级阶段的个性化广告匹配系统能有效提高广告转换率,甚至我连其能否做到预想中的精确广告都十分怀疑。这种基于统计学的广告匹配模式对用户数据的需求量极大,此外对数据也有比较严格的要求,如果缺少这样的数据那分析得出的结果是残缺的,不仅不能提高用户定位的精度,反而有可能造成用户定位的进一步偏离。

我想拥有比Yahoo和Microsoft更多用户数据的Google之所以没有结合用户的数据来进行个性化的广告匹配,正是出于对这两个原因的考虑。Google目前的广告投放系统主要是通过分析网页内容来匹配广告内容,这么做的不足在于,浏览同一个网页的用户看到的广告大体上可以理解为是无差异的(但不是完全一样,可以理解为每次从一个不大的集合中随机选取几个元素进行展示)。但优势在于匹配到“用户对广告产品了解的信息不足但对其具有需求”的用户的几率应该是目前的精准广告投放模式中最高的。

在我看来,目前精准广告投放系统的发展趋势应该是和搜索结果的改进的趋势类似的,都是向结合用户个人信息重新调整匹配的广告/搜索结果的排序的方向发展。只是和搜索引擎在个性化搜索的探索类似,目前似乎成效并不明显。判断一个广告投放系统的效果应该通过实验得出,而不是通过判断并没有一个具体比较标准的目标用户定位精确程度来获知。在个性化广告匹配系统的发展仍然不完善的情况下,宣扬通过个性化广告匹配系统能达到精确用户定位其实是一种欺诈,因此到底哪个广告投放系统才是最精准的广告投放系统呢?

2007年10月14日 星期日

YouTube的盈利模式

YouTube目前的盈利模式主要是通过与传统的视频内容提供商签订协议,以YouTube为平台投放视频并且与Google分享页面上的AdSense广告收入。但这种盈利模式只是互联网的传统广告盈利模式,而且用于盈利的视频来源不是网络视频,这等于根本没有利用到YouTube自身的资源。YouTube拥有数量庞多的原创网络视频,如果能找到一种有效的途径来利用这些视频进行盈利,那将是一份不可小视的收入。

Google在收购YouTube后一直疲于应对版权诉讼,因此在收购一年来基本上没有精力去探索YouTube的盈利模式,所做的仅仅是为了清还YouTube以前惹下来的无头债。经过一年的努力,Google基本上将YouTube和一些大公司的版权纠纷和解了,除了部分特别顽固不愿与Google分享广告收入坚持要诉讼的公司外,大多数公司都与Google达成了相关的合作计划。不过在解决了这一大堆的麻烦后,Google自然是不会将YouTube这块大蛋糕弃之不顾的。在上个星期,Google正式将YouTube与Google AdSense进行整合。

YouTube与AdSense的整合目前是以这种形式进行的:Google与超过100名的视频制作者或视频提供商签订了协议,他们所创作的视频将被用于AdSense Video Units的文字广告的匹配。但这一模式面临的最大的问题还是来自版权。Google目前所采用的解决方法是选择有良好信誉的合作者来避免触犯版权问题,但这一解决方式无疑是十分低效的。大部分的视频作者的信用无法被有效评估,导致只有少部分的用户能参与到制作用于AdSense Video Units的匹配视频,这造成了用于匹配的视频种类和基数的不足,从而造成匹配广告的相关度下降,进而造成用户体验下降。此外由于大部分视频作者未必能准确判别所引用的素材是否侵犯版权,这种以用户为评判对象的评判标准也不尽合理。

理想的情况自然是YouTube拥有一个完善的版权识别系统,能判定视频是否侵权以确定该视频可否用于与AdSense Video Units进行匹配。Google早已多次宣称该系统正在开发中,但迟迟未能应用到YouTube中,可见其判定效果仍无法达到一个较为让人满意的效果。目前这种技术主要依赖于侵权视频的数据库的完善程度,这就好比只靠识别码清除病毒的杀毒软件,永远只能跟在病毒的屁股后面,对于新的病毒是无能为力的。只是病毒有相应的行为特征,所以杀毒软件可以开发主动防御系统来在一定程度上弥补这一点。但目前尚无方法可以使计算机理解视频内容,自然无法在这种技术上实现类似主动防御系统的效果了。

而且AdSense Video Units面临的还不仅仅是用于匹配的视频不足的问题。即便AdSense Video Units解决了版权问题,获得了足够多的用于匹配的各类视频。但还会面临一个可能因匹配广告不相关而引发的法律问题。试想一下这种场景,你的一个个人展示视频被用于匹配某个脱发再生的文字广告并且在多个网页中多次出现,那由于电视广告多年来培养的用户习惯。观看广告者很有可能认为你是该脱发再生服务的受益者,但实际上你有可能和该产品根本没有任何联系,但该广告却对你的名誉造成的损害。在这种情况下即便Google获得了拥有该视频版权的作者的授权,那还是有可能会被控告侵犯名誉权。

和YouTube目前的视频广告的形式不同,AdSense Video Units所展示的广告是和该视频内容相关的文字广告。受传统电视广告所培养的习惯的影响,用户很有可能将文字广告与视频人物、事件等相联系。但是和电视广告不同的是这些视频并非为特定的广告商所制作的,仅仅是由Google的AdSense广告系统自动进行匹配的。但由于目前用于视频广告匹配的精度上未能达到一个较高的水准,也许这种尴尬的误会出现的几率会很高。而YouTube的视频广告由于是采用内嵌视频的形式来展示广告,用户可以有效区分出广告视频和原视频之间的关系,所以不存在这种问题。但文字广告仍将在很长一段时间内占据着广告投放的重要地位,因此Google也不可能放弃这种匹配模式。但要在技术上解决这一问题的难度极大,Google也许会因此再次陷入繁琐的法律纠纷中。

可见YouTube的盈利模式基本都受到了种种法律的限制,所以Google在YouTube的盈利模式探索上做得十分小心谨慎。YouTube无疑充满了盈利的巨大潜力,但是如何有效地对其进行挖掘却是个大难题。Google接下了这个烫手的山芋,但不知道要花多长时间才能把它吃下去呢?说来讽刺,如果YouTube是在国内也许就不用考虑那么多版权问题了,国内的视频站的流量很大一部分来自侵权视频。但由于国内法律体制的不完善,导致版权所有者无法有效地维护自身权利。只是同样由于这一点,国内的商业市场极不规范,要想浑水摸鱼且全身而退也并不容易。而美国拥有一个相对规范的商业市场,却也是因为其拥有较为完善的法律体制的原因。所以YouTube的盈利模式仍是迷雾重重,且看Google能否拨开迷雾看清本质吧。

2007年10月13日 星期六

整合多种元素的Google Maps--地理信息聚合平台

随着整合mapplets以及用户利用My Maps创建的公共地标,Google Maps上的元素原来越多了。我觉得现在的Google Maps已经很有必要包含整合搜索以及个性化搜索,来帮助用户更加精确有效地获取更多的信息。不过就Google Maps目前获取这些元素的途经来看,要进行对这些元素的有效排序比较还是比较困难的。以mapplets的地标为例,这些地标能被Google Maps获取仅仅是因为他们被用户标记了GeoTag。但Google对其内容本身是什么毫无了解。因此Google无法判断不同元素之间与用户的搜索意图的相关性。

同时正如我以前所提到的,这也造成了一种利用其来进行Spam的潜在风险。比如我是某个旅游区的餐厅经营者,我可以通过将图片上传到Panoramio并标记相应的坐标,以达到当用户勾选了Photos from Panoramio的mapplets时,搜索相关的旅游地区信息时会看到我的餐厅的图片的广告宣传效果。但实际上搜索的用户想看到旅游区餐厅信息的几率很低,他们更希望看到的是旅游区的风景图片之类的信息。因此mapplets在这种情况下不仅不能提供更多对其有用的信息,反而会因为增加了更多的无效信息而造成用户体验的下降。

然而Google目前对mapplets中的内容基本上是没有进行审核的,因此如果这种方法被大量应用,很可能会造成用户对mapplets的反感,直接禁用mapplets。因此Google Maps如果要增加整合搜索,那首先应该要解决信息的获取途径这一问题。Google Maps目前对mapplets以及用户利用My Maps所创建的地标,均无法获得更多的描述信息以判断其内容相关度。因此Google第一步所要做的是改善这种第三方地标的获取方式,我想这对于Google来说并非什么难事,毕竟Google在图片搜索和视频搜索上已经有了相应的基础,并且也已经有了在通用搜索上的整合搜索作为参照模型,算法在一定程度上应该是可以借鉴的。

然而整合搜索要做到准确判定用户搜索的意图并不容易,单纯的整合搜索仅仅是通过用户搜索的关键词与数据库中的各类元素的匹配数量做比较,而决定是否显示某一类元素。但这种算法很容易受元素基数的影响,特别是在Google Maps目前的各类元素坐标尚未达到充足状态的情况下就更是如此了。此外这种匹配方式更适合于热点关键词,因为热点关键词一般用户的搜索意图都是相近的,因此整合搜索的热点式统计方法的覆盖精度是可被接受的。但对于一些比较小众的关键词,则由于用户基数的不足,热点式统计的覆盖精度将大幅度下降。

因此,对于这类型关键词则需通过收集足够的用户的信息以精确定位其搜索意图,以结合调整显示的元素类型。也就是所谓的个性化搜索了。不过Google目前用于通用搜索的个性化搜索模式(收集用户的搜索记录和网页访问记录),我觉得Google Maps的信息收集应注重该用户的其它Google 服务的信息。我可以很快地想像到这样两个片段:

  1. 某个用户正在用GTalk聊天,其中谈话内容涉及到午餐地点的推介。当对方向其做出推介后,其很可能会用Google Maps定位到相应区域来查看相关的信息。此时如果能结合GTalk的聊天记录,那Google Maps就会突出显示餐厅的坐标,并且会触发整合搜索的图片、视频元素来帮助用户了解餐厅的具体情况以及其他用户的评价。
  2. 某个用户将要进行一次商务旅行,在准备过程中自然会为了了解相关信息使用Google搜索,用Gmail进行联系确认,用Google 日历制定日程表等工作。而如果Google Maps能有效地整合这些信息,那对于用户的定位无疑将会有很大的改善。

用户在使用Google Maps时的搜索意图和使用Google通用搜索时的搜索意图不同,使用Google Maps时的搜索意图大部分都是与近期的相关活动有关,但使用Google通用搜索时则不然,搜索一个关键词时最优结果涉及的因素很多,因此必须结合历史记录进行更深层次的分析(虽然Google目前似乎做不到)才能达到较好的效果。因此实际上Google Maps进行整合搜索和个性化搜索的结合要比Google通用搜索要简单和有效,难度恐怕更多的在于描述信息以及地标信息源不足。

Google Maps目前的mapplets中的地标和用My Maps创建的社区地标都是用户主动创建并且进行相应的坐标标识的。但互联网上有许多没有通过GeoTag标识的地理信息,这些信息由于缺乏GeoTag导致Google无法将其整合入Google Maps中,这无疑是很大的损失。因此Google还需要做的是通过网页信息来自动对这些元素进行定位,将其整合入Google Maps中。但要做到这一点的难度就相当大了,恐怕要在匹配的其它技术有较大程度上的发展后才可以达到较好的效果。

可以想象随着Google Maps整合的深入,或许其将成为继Google通用搜索后又一占据绝对优势的信息聚合平台。Google Maps也正是在朝地理信息聚合平台的方向发展的,相比起目前更多的类似于工具式的应用,只有具备了信息处理的能力后,Google Maps才能真正成为一个对于用户具有举足轻重价值的服务。这正是Google正在做的,可以看到,不仅仅是Google Maps,Google同样在对其它各种服务进行深层次的整合,而这些整合最终的目的都是使其信息处理的能力达到最高。致力于帮助用户不断提高信息处理的效率,恐怕这正是Google在互联网时代长盛不衰的原因吧。

Creative Commons License
除非另有声明,本网站采用知识共享署名-非商业性使用-相同方式共享 3.0 许可协议授权。