2007-8-6 18:02:00
创业博客(5):中小网站的搜索完全可以外包

在很长一段时间,我在自己的博客上尝试招聘,种种方法无所不用其极啊,比如连直接“喊话”都用上了:“我特别希望有在垂直搜索网站负责技术的哥们,快“反水”吧。:)。。。。。。蚂蚁网诚招搜索相关技术人员,都招了半年了快。哥几个别做垂直搜索了,来蚂蚁网吧”。但还是没找到合适的搜索人员。:)

 

蚂蚁网自从去年上线,我们技术团队一直缺一个搜索方面的人员。现在可以说了,我们的站内搜索原来一直用的SQL自带的搜索,效果可想而知。尤其要命的是,在以前一个版本的蚂蚁网,我们首页就是一个“搜索框”,以搜索为入口展开业务流程。在这种设计之下,没有专业搜索功能的蚂蚁网,其实是“自曝其丑”,把自己最弱的一项放在最显著的位置传递给用户。当时,很多业界的朋友访问蚂蚁网,首先就会使用首页大大的搜索功能,然后效果不好,于是对蚂蚁网颇多否定。对此,我们只好默认,然后全力以赴想找一个搜索技术人员。

 

但作为创业公司,资源不是随心所欲的。我们寻找专业搜索技术人员的路径也是非常坎坷。很多时候,需要缘分。但很可惜,我们运气不好,也谈了几个搜索人员,其中一个蛮合适的,本来都答应加盟蚂蚁网了,后来又因个人原因没能过来。对此,我只有在遗憾之余,再度千方百计寻找搜索人员,包括上述“喊话”。:)

 

但现在国内优秀的搜索人员太难找了。“搜索”,目前是显学啊!高手喜欢自己做站,或者在百度、google等大公司,真正能找到的往往多数还是搜索入门水平的人员。后来我发现,我的这种困境并非特例,很多类似的创业公司都在这里出现了问题。

 

 

但是我的运气终于还是不错,哈哈。4月底,我和詹膑聊天,说起这个话题,他灵机一动,问我为什么不找霍矩和tinyfool他们谈谈。哈哈,一语点醒梦中人啊。霍矩和tinyfool成立的银杏技术咨询,似乎正好是为中小互联网公司提供技术咨询解决方案;而且这两个哥们的技术能力超强,业界基本上一致口碑。

 

5月初,我找了个机会和霍矩聊了聊,没想到一拍即合,他们正好在做这方面的解决方案;于是我们约好,等新版蚂蚁网上线后,就开始合作。7月中旬,我们和银杏技术咨询的合作正式开始,银杏技术咨询有一个打包的搜索服务方案,比较标准化的流程提供给蚂蚁网。也就二十来天的功夫,我们新版搜索系统上线了。

 

蚂蚁网新版搜索系统如何,用户“布衣”的帖子凑巧能做个证明:

 

第一天,旧版搜索,布衣:“这个搜索能用吗?我搜念珠出来一堆摩托罗拉”

第二天,管理员:“再试试搜索“念珠”呢——我们今天刚刚升级了搜索功能”

第三天,新版搜索,布衣:“再搜念珠没有摩托罗拉了·····是准确了”

 

 

短短二十来天,依靠外包银杏技术咨询的开发,解决了困扰蚂蚁网将近10个月的搜索难题。从自己的案例,我由衷感到,对于中小网站来说,搜索完全可以外包。因为“搜索”是一个网站的标配,必须有且要做好;但往往不是核心服务(很少有中小网站整个站就是做搜索);同时往往很难找到合适的搜索人才加盟;所以对于中小网站来说,外包是一个快速、节约、靠谱的方案。

 

当时,我就不应该花太多精力试图找专业搜索人员加盟,很难找,并且太影响业务展开了。我把蚂蚁网自己走的弯路写出来,希望后来者能避免我们的教训。

 

 

相关阅读:

创业博客(1):mayi.com域名的故事

创业博客(2):stay foolish

创业博客(3):揭秘蚂蚁网设计运营细节之一

创业博客(4):“这么早就开始回忆”——蚂蚁网过去的8个月

 

麦田 发表于 2007-8-6 18:02:00 阅读全文 | 回复(25) | 引用通告 | 编辑
2007-8-6 18:17:00
Re:创业博客(5):中小网站的搜索完全可以外包
fqf(游客)我觉得"lucene+中文分词技术",可以较好的实现网站搜索方面。

我之前也做过这个方面,在此只能提写个人小看法,相信这些方面的搜索技术mayi可以很快的驾奴使用。
fqf(游客)发表评论于2007-8-6 18:17:00 个人主页 | 引用 | 返回 | 删除 | 回复
2007-8-6 18:54:00
Re:创业博客(5):中小网站的搜索完全可以外包
tiger(游客)麦田你应该学点基本的技术。

早该解决的事情,才想到。

tiger(游客)发表评论于2007-8-6 18:54:00 个人主页 | 引用 | 返回 | 删除 | 回复
2007-8-6 19:46:00
Re:创业博客(5):中小网站的搜索完全可以外包
wkcow(游客)谁知道你要的仅仅是站内搜索?
至少我不知道,虽然我不是哪哥几个
wkcow(游客)发表评论于2007-8-6 19:46:00 个人主页 | 引用 | 返回 | 删除 | 回复
2007-8-6 20:01:00
Re:创业博客(5):中小网站的搜索完全可以外包
不死鸟(游客)lucene+中文分词技术 完全可以做到
不死鸟(游客)发表评论于2007-8-6 20:01:00 个人主页 | 引用 | 返回 | 删除 | 回复
2007-8-6 20:15:00
Re:创业博客(5):中小网站的搜索完全可以外包
ericsheng(游客)不知道您网站的关联推荐服务能否也外包出来,呵!
我们正在做基于用户行为的关联推荐服务,与DOUBAN等的算法不是太一样,我们的算法计算用户行为,可以随着用户行为数据的增长,较正推荐的结果.

详见: http://www.8fangnet.com
正在使用我们服务的网站: http://www.sanbaa.com/bbs/
http://bbs.20ju.com
ericsheng(游客)发表评论于2007-8-6 20:15:00 个人主页 | 引用 | 返回 | 删除 | 回复
2007-8-6 22:13:00
lucene+分词技术,我们已经实践过
麦田(游客)
以下引用fqf(游客)在undefined发表的评论:
我觉得"lucene+中文分词技术",可以较好的实现网站搜索方面。

我之前也做过这个方面,在此只能提写个人小看法,相信这些方面的搜索技术mayi可以很快的驾奴使用。


lucene+分词技术,我们已经实践过,但关键是分词技术不够好,所以不理想;但外包给银杏之后,分词这块就过关了。
麦田(游客)发表评论于2007-8-6 22:13:00 个人主页 | 引用 | 返回 | 删除 | 回复
2007-8-7 9:51:00
Re:创业博客(5):中小网站的搜索完全可以外包
z(游客)外行领导内行太可怕了 同样可怕的是 外行领导外行
z(游客)发表评论于2007-8-7 9:51:00 个人主页 | 引用 | 返回 | 删除 | 回复
2007-8-7 10:18:00
Re:创业博客(5):中小网站的搜索完全可以外包
yinwei(游客)外包给别人的缺点就是,不能很好实现自己本站的站内搜索,一个中小网站内部,配备一两个搜索方面的人才应该是必备的,通过他们才能根据自己站点的特殊性来做到搜索精准度和效率方面的最好,外包只能解一时只需,越到后面,你们遇到的问题可能就越多。麦田应该不要过于乐观,不能因为这样一时的解决就以为无后顾之忧了。
yinwei(游客)发表评论于2007-8-7 10:18:00 个人主页 | 引用 | 返回 | 删除 | 回复
2007-8-7 10:53:00
Re:创业博客(5):中小网站的搜索完全可以外包
dengf(游客)楼上的说的很对,不做技术的不知道技术的深浅. 以为一时取得的成绩就可以一劳永逸了.目前只能说MAYI的搜索只是个好的开端(比以前改进很大).搜索的学问很大,并不是一次外包就能完美的.
dengf(游客)发表评论于2007-8-7 10:53:00 个人主页 | 引用 | 返回 | 删除 | 回复
2007-8-7 11:08:00
Re:创业博客(5):中小网站的搜索完全可以外包
问题(游客)
以下引用yinwei(游客)在undefined发表的评论:
外包给别人的缺点就是,不能很好实现自己本站的站内搜索,一个中小网站内部,配备一两个搜索方面的人才应该是必备的,通过他们才能根据自己站点的特殊性来做到搜索精准度和效率方面的最好,外包只能解一时只需,越到后面,你们遇到的问题可能就越多。麦田应该不要过于乐观,不能因为这样一时的解决就以为无后顾之忧了。

这是一个比较大的问题啊,也想听听麦田对于这个问题的看法。我开始也有点心动把本站的搜索部分外包出去了,可还是有点担心后续发展问题。
问题(游客)发表评论于2007-8-7 11:08:00 个人主页 | 引用 | 返回 | 删除 | 回复
2007-8-7 11:39:00
关于搜索外包之后的问题
麦田(游客)楼上几位网友提到,搜索外包之后,“后顾之忧”;就我和银杏咨询的合作来说,我们没有这个担忧;我们签订的是年度服务合同。对于此事,大家如果希望更多了解,可以直接问问银杏咨询,他们的网址我主帖中提到了。
麦田(游客)发表评论于2007-8-7 11:39:00 个人主页 | 引用 | 返回 | 删除 | 回复
2007-8-7 13:08:00
Re:创业博客(5):中小网站的搜索完全可以外包
支持maitian(游客)搜索“妈的”似乎不准确:
http://search.mayi.com/goods/妈的/0,0,1,0.html
支持maitian(游客)发表评论于2007-8-7 13:08:00 个人主页 | 引用 | 返回 | 删除 | 回复
2007-8-7 13:29:00
Re:创业博客(5):中小网站的搜索完全可以外包
kns1024wh要看你的钱多钱少
kns1024wh发表评论于2007-8-7 13:29:00 个人主页 | 引用 | 返回 | 删除 | 回复
2007-8-7 14:16:00
Re:创业博客(5):中小网站的搜索完全可以外包
门中人Lucene+中文分词。真正掌握要领的人有多少。这个东西我也用过。可就lucene的制作索引和中文分词字典就有很深的学问。不要以为懂得用什么技术就可以做好它。
小弟不才也是个IT,但是在小公司里面做IT的,什么都要自己搞,什么都要自己学。对于这种IT的开发模式很是看不下去。软件外包才是出路。
门中人发表评论于2007-8-7 14:16:00 个人主页 | 引用 | 返回 | 删除 | 回复
2007-8-8 14:51:00
Re:创业博客(5):中小网站的搜索完全可以外包
idcsea再小点的网站,就可以用google的站内搜索引擎了
idcsea发表评论于2007-8-8 14:51:00 个人主页 | 引用 | 返回 | 删除 | 回复
2007-8-8 16:00:00
Re:创业博客(5):中小网站的搜索完全可以外包
stone2.0(游客)建议 麦田 把 所有开发工作全部外包。
stone2.0(游客)发表评论于2007-8-8 16:00:00 个人主页 | 引用 | 返回 | 删除 | 回复
2007-8-8 16:04:00
Re:创业博客(5):中小网站的搜索完全可以外包
入党申请书(游客)完全外包的话,后续发展会不会有问题啊?这点值得考虑.
入党申请书(游客)发表评论于2007-8-8 16:04:00 个人主页 | 引用 | 返回 | 删除 | 回复
2007-8-8 18:22:00
Re:创业博客(5):中小网站的搜索完全可以外包
并非真正搜索(游客)

创业精神可嘉,但技术不敢恭维,而且外包的这点技术更如此!真正的搜索需要自有核心的技术。
刚才看Blog后才知道有个蚂蚁,去试了一下搜索,发现还是基于关键字搜索吧,感觉没有中文分词。离真正意义上的搜索还很有差距。
比如搜“自然 语言”会分别显示包含“自然”或“语言”的信息,但搜索“自然语言”(无空格)就没有结果了。
还有个问题,我就在这个帖标题加了几个字,提交说名字不能为孔,结果重新定向把以前写的信息也丢了:( 先有点基本的技术积累吧!可以做个简单的客户端校验或提交错误后保留原有信息!
并非真正搜索(游客)发表评论于2007-8-8 18:22:00 个人主页 | 引用 | 返回 | 删除 | 回复
2007-8-8 18:58:00
Re:创业博客(5):中小网站的搜索完全可以外包
stone2.0(游客)之所以建议 麦田 将 开发全部外包的原因:

1.从蚂蚁网的现状来看,其团队的软件开发能力较弱。bug较多。功能很差。

2.蚂蚁网的开发团队无法实现 麦田的很多意图,让麦田的理论与实践产生巨大的落差,为一些人所耻笑。

3.通常,作为非一线开发者或一线技术专家,自己组织开发队伍成本较高,不经济,且无法找到合适的人才。之所以这么说,是因为一个例子:饭否网站的创始人本身就是技术专家,且有很好的同为技术专家的同学和校友资源,因此其组织个技术队伍较容易,开发东西又快又好。这个例子说明:饭否的创始人 因为其背景和个人专业,能够比较容易的找到 低成本的且非常高级的技术人才。而 蚂蚁网的 麦田做不到。当然,我认为饭否创始人也因为其学校背景和技术背景 有能力说服 其校友或技术伙伴一同创业,这样的话,技术人员的成本就更低。

4因为我也是作网站,对找技术人才的困难有切身的感受。很难找到合适的人才:没有接触高级的合适人才的渠道,且没有非常强的辨别能力,最主要的无法支付成本。
stone2.0(游客)发表评论于2007-8-8 18:58:00 个人主页 | 引用 | 返回 | 删除 | 回复
2007-8-8 19:17:00
Re:创业博客(5):中小网站的搜索完全可以外包
stone2.0麦田的博客说:中小网站的搜索完全可以外包

我在留言中,建议其将网站开发全部外包,

之所以建议 麦田 将 网站开发全部外包的原因:

1.从蚂蚁网的现状来看,其团队的软件开发能力较弱。表现在:Bug较多、功能较弱。

2.蚂蚁网的开发团队无法实现 麦田的很多意图,让麦田的理论与实践产生巨大的落差,为一些人所耻笑。

3.通常,作为非一线开发者或非一线技术专家,自己组织开发队伍成本较高,不经济,且无法找到合适的人才。之所以这么说,是因为一个例子:饭否网站的创始人本身就是技术专家,且有很好的同为技术专家的同学和校友资源,因此其组织个技术队伍较容易,开发东西又快又好(饭否 网 的开发比较快,网站质量很高,功能很完善)。这个例子说明:饭否的创始人 因为其背景和个人专业,能够比较容易的找到 低成本的且非常高级的技术人才。而 蚂蚁网的 麦田做不到。当然,我认为饭否创始人也因为其学校背景和技术背景 有能力说服 其校友或技术伙伴一同创业,这样的话,技术人员的成本就更低。

4.因为我也是作网站,对找技术人才的困难有切身的感受。很难找到合适的人才:没有接触高级的合适人才的渠道,且没有非常强的辨别能力(技术人才众多,鱼龙混杂,无法分辨其水准),最主要的无法支付自己供养技术人才的成本。

5.当然做外包,也不容易,我刚开始做网站时候,也在软件项目交易网,各种PHP论坛,发布了广告,但是没有一个令自己放心和满意的结果。

但不论怎样,作为没有很多资金支持的网站创业者,或者没有足够时间和精力管理开发团队的创业者,将网站开发外包出去都是最好的选择。当然我也期待着更多专业的、有诚信的(避免自己花钱开发,体现了自己的意图和功能设计的的网站程序,被开发工作室卖给第三方) 软件开发工作室的出现。

stone2.0发表评论于2007-8-8 19:17:00 个人主页 | 引用 | 返回 | 删除 | 回复
2007-8-8 20:41:00
晕,完全不同意楼上stone2.0的建议
maitian99(游客)呵呵

蚂蚁网目前的开发团队,其实做的不错;蚂蚁网目前产品的诸多问题,主要是我们还没开发完。
maitian99(游客)发表评论于2007-8-8 20:41:00 个人主页 | 引用 | 返回 | 删除 | 回复
2007-8-14 18:02:00
Re:创业博客(5):中小网站的搜索完全可以外包
dnsmaster(游客)啥开发团队,就一个人罢了
dnsmaster(游客)发表评论于2007-8-14 18:02:00 个人主页 | 引用 | 返回 | 删除 | 回复
2007-8-16 22:54:00
Re:创业博客(5):中小网站的搜索完全可以外包
coreseek(游客)http://www.coreseek.com/product.cn.htm

刚发布的引擎,比Lucene至少快5倍
coreseek(游客)发表评论于2007-8-16 22:54:00 个人主页 | 引用 | 返回 | 删除 | 回复
2007-8-31 22:59:00
Re:创业博客(5):中小网站的搜索完全可以外包
sclzmbie(游客)有个疑问,你为什么不买一个google的硬件呢? 内置了google的搜索算法。
sclzmbie(游客)发表评论于2007-8-31 22:59:00 个人主页 | 引用 | 返回 | 删除 | 回复
2007-8-31 23:09:00
Re:创业博客(5):中小网站的搜索完全可以外包
sclzmbie(游客)还有海量科技等等公司的技术,花点钱买过来用就可以了,不知道为什么从开始就没采用呢? 还需要花钱找咨询公司?

另外对于蚂蚁网我用过一次,建立了一个关于欧美漫画的什么组吧,然后我自己就再也进不去那个组了,感觉很糟糕,再也没上过蚂蚁。不知道现在怎么样了,呵呵。
sclzmbie(游客)发表评论于2007-8-31 23:09:00 个人主页 | 引用 | 返回 | 删除 | 回复
发表评论:
载入中……