做外贸Google优化须知:Google 搜索引擎算法-Google 专利清单

首页 >> SEO知识 >> 做外贸Google优化须知:Google 搜索引擎算法-Google 专利清单

Google 搜索引擎算法-Google 专利清单

 

搜索引擎Google
先来了解搜索引擎GoogleGoogle是全球第一的搜索引擎,无论是技术还是使用率,在中国有相当一部分人存在一个误区,认为百度比Google要强,这就绝对是井底之蛙了, 现在经济全球化了,我们的市场不仅仅是一个中国,而是全世界,让产品网络覆盖全球,是每个老板都梦寐以求的事,全球推广是实现梦想的桥梁。本文介绍Google算法,了解Google的技术,对Google全球范围的推广都有效果。

Google
由两名在斯坦福大学的博士生佩吉 (Larry Page) 和布林 (Sergey Brin) 开始。他们带来了一个给网页评估的新概念。这个概念, 称网页级别 (PageRank), 是从Google 算法[2]重要的开端 。网页级别十分倚赖导入链接 (incoming link),并利用这种每个导入某网页的链接相当于给该网页价值投一票的理论建立起逻辑系统。越多导入链接意味着该网页越有“价值”。而每个导入链接本身价值直接根据该链接从何而来的网页级别,以及相反的该页导出链接(outgoing link) 。

在网页级别帮助下,Google 在服务相关的结果上证明它相当优异。Google 成为了最普遍和最成功的搜索引擎。由于网页级别度量了站点外因子, Google 感到它会比页内因子难以动手脚。

然而道高一尺魔高一丈。网站管理员们已经开发出对付Inktomi 搜索引擎的链接操作工具和计划。这些方法证明对Google 算法一样管用。许多站集中于交换、买卖大量链接。随着‘站长寻求获取链接只单单要影响Google送更多流量给该站,而不管是否对站点访客有用否’这种行为增加,网页级别对原始算法的信赖度渐渐被破坏了。

此时,是Google 和其它搜索引擎对广大范围的站外因子仔细查看的时候。开发更加聪明的算法有其他原因。互联网已经膨胀到拥有非技术的广大族群。他们经常无法使用先进的提问技术来取得信息;而且他们得面对比起发展早期更庞大数据、更复杂的索引。搜索引擎必须开发具备预测性、语义性、语言性和启发性算法。

目前,网页级别的缩小版仍然被显示在Google 工具条上,不过网页级别只不过是Google考虑在网页分级时超过100个因素里中的一个。

今天,大多数搜索引擎对它们的如何评等的算法保持秘密。搜索引擎也许使用上百因素在排列目录;每个因素本身和因素所占比重可能不断的在改变。

大部分当代搜索引擎优化的思路──哪些有效、哪些没效──这些很大部分在于观察与根据内线消息来的猜测。某些seo人运行控制下的实验以取得不同优化方法的结果。

尽管如此,以下是搜索引擎发展它们算法时的一些考虑,另,这份Google 专利清单也许读者可看出他们会走哪条路线:
站点的年龄
自该网域注册后过多久

内容的年龄

新内容增加的规律性

链接的年龄,连接站点的名誉和其相关程度

一般站内因素

负面站内因素 (例如,太多关键字汇标(meta tag),很显然被优化过,会对站点造成伤害)

内容的独特性

使用于内容的相关术语 (搜索引擎关系到的术语的方式视同如何关系到网页的主要内容)

Google
网页级别 (只被使用在Google 的算法)

外在链接、外部链接的链接文字、在那些和在站点/网页包含的那些链接

引证和研究来源(表明内容是研究性质)

在搜索引擎数据库里枚举的词根与其相关的术语(如 finance/financing

导入的逆向链接,以及该链接的文字

一些导入链接的负面计分 (或许那些来自低价值页、被交换的逆向链接等)

逆向链接取得速率:太多太快意味着“不自然”的链接购买活动

围绕在导出链接、导入的逆向链接周围的文字。例如一个链接如果被 "Sponsored Links" (赞助商链接)包围,该链接可能会被忽略。

"rel=nofollow" 建议搜索引擎忽略该链接

在站点该文件的结构深度

从其他资源收集的网格表,譬如监视当搜索结果导引用户到某页后,用户有多频繁按浏览器的返回钮

从来源像:Google AdWords/AdSenseGoogle 工具条等程序收集的网格表

从第三方数据分享协议收集的网格数据 (譬如监测站点流量的统计程序提供商)

删除导入链接的速率

使用子网域、在子网使用关键字和内容质量等等,以及从这些活动来的负面计分

和主文件语义上的链接

文件增加或改动的速率

主机服务商 IP 和该 IP 旗下其它站点的数量/质量

其他链接站会员 (link farm / link affiliation) 与被链接的站 (他们分享IP? 有一个共同的邮递地址在"联络我们(Contact Us" 页吗?

技术细节像利用301重定向被移除的网页、对不存在网页显示404服务器标头而非200服务器标头、适当的利用
robots.txt
主机服务商正常运行时间

是否站点对不同类的用户显示不同的内容 (掩饰 (cloaking))

未及时矫正、无效的导出的链接

不安全或非法内容

HTML
代码品质,以及错误出现数

由搜索引擎自他们搜索结果观察到的实际点击通过率评等

由最常访问搜索结果的人手动评等

[
编辑] 搜索引擎优化和搜索引擎之间关系

在第一代搜索引擎发表后,搜索引擎操作员变得对搜索引擎优化社区感兴趣。在一些早期搜索引擎, 譬如INFOSEEK,要得到第一名不过是把顶尖的网页代码抓下、放在您的网站、并提交个URL让搜索引擎立即索引并排名该页这么简单。

由于搜索本身的高价值和标定性,搜索引擎和搜索引擎优化员间自始便存在对抗的关系。最近一次于2005 年召开的AirWeb年会,旨在谈论缩小这种敌对关系差距,和如何最小化某些太过于侵略性优化造成的损坏效果。

某些更具侵略性的优化员产生自动化的站点,或者使用某些最终会让该网域被搜索引擎扫地出门的技术。而大多数优化公司则销售长期、低风险的策略服务,而且大部分使用高风险战略的优化公司,则在他们旗下的会员点使用、产生商业线索、或者纯内容站点,而非让它们客户站亲身涉险。

这里提供一个使用侵略性优化技术的优化公司让他们客户被取缔的案例。华尔街时报描述了某个使用高风险技术和涉嫌没有透露客户得承担那些风险的公司[4]Wired报告了该公司起诉某博客,因为提及该公司被取缔[5]Google 的克特斯 (Matt Cutts) 稍后确认Google 确实取缔了Traffic Power以其他们的客户群[6]

某些搜索引擎对搜索引擎优化产业提供了援助,而且是常常是优化会议和研讨会的赞助商和来访贵宾。实际上,自从付费收录 (paid inclusion) 降临,一些搜索引擎现在在网站优化社区的健康有了既得利益。所有主要搜索引擎都提供信息/指南以协助站点优化: Google[7] Yahoo [8], 和MSN[9]Google提供了Sitemaps 程序[10]帮助网站管理员学习如果Google 有任何问题检索他们的网站时该如何做,并且提供Google流量与您网站关系间无价的丰富数据。雅虎的SiteExplorer[11],旨在提供一个免费方式递交您的URL, 该方法能让你决定打算让雅虎索引多少页、索引多深。雅虎的Ambassador Program[12] GoogleAdvertising Professionals[13] 提供专家级的认证。

搜索引擎入手
新站点不需要"提交"到搜索引擎才能登记上市。一个来自于以建立好的、其他站点的简单链接就会让搜索引擎拜访新站点,并且开始‘爬’过该站内容。它可能得花几天甚或几周从这样一个已建立站点取得链接,并使所有主要搜索引擎开始拜访并索引新站点。

一旦搜索引擎发现了新站点,它一般将拜访和开始索引该站,直到所有标准的 超链接被链接的页索引到为止。只能通过FlashJavaScript才能拜访的链接可能不会被蜘蛛机器人找到。

当搜索引擎的蜘蛛机器人爬过一个站点时会取决相当数量的不同因子,并且该站的许多页可能不会被索引到除非它们网页级别、链接、或流量增加到一个程度。从站点的根目录到该页的距离,以及其它比重考量,也许也是决定是否该页得到检索的因素。Cho et al.Cho et al. 1998 [14] 描述了哪些页会被拜访、哪些会收入搜索引擎索引的决定标准。

网站管理员可通过在网域根目录里标准robots.txt文件指示蜘蛛机器人不索引某些文件或目录。标准的实现要求是搜索引擎在拜访这个网域时参考这个文件,虽然搜索引擎的蜘蛛机器人当它拜访某站点网页时将保留这个文件的高速缓存拷贝,并且更新速度没像网站管理员那么快。网站发展人员可能使用这个特性防止某些页,譬如购物车或其它动态、特定用户的内容出现在搜索引擎结果中,并且防止机器人进入死循环和其它机器人陷阱。

对于某些有偿提交的查寻引擎(像雅虎),支付象征性费用提交也许会节省一些时间,虽然雅虎有偿提交方案不保证提交人/公司包括在他们的查寻结果中。中文的搜狐和新浪ask等需要支付一定费用,但免费的非商业网站可以提供,当然搜索引擎方并不保证一定收录相应的网站。

白帽方法
搜索引擎优化的白帽法包括遵循搜索引擎哪些可接受哪些不能接受的指导方针。他们的建议一般是为用户创造内容,而非搜索引擎、是让这些内容易于被蜘蛛机器人索引、并且不尝试对搜索引擎系统耍花招。经常网站管理员于设计或构建他们的网站犯了致命错误、疏忽地"毒害" 该站以致排名不会很好。白帽法优化员企图发现并纠正错误,譬如机器无法读取的菜单、无效链接、临时改变导向、或粗劣的导引结构。

因为搜索引擎是以文本为中心,许多有助于网页亲和力的同样手段同样便利于搜索引擎优化。这些方法包括最佳化图形内容、包括ALT 属性、和增加文本说明。甚至Flash动画可于设计该页时包括替代性内容──这本来用来给访客无法阅读Flash的环境用的──来帮助优化。

这里是一些搜索引擎认为适当的方法:
寻找SEO合作关系,建立长期合作关系。
在每页使用一个短、独特、和相关的标题。
编辑网页,用与该页的主题有关的具体术语替换隐晦的字眼。这有助于该站诉求的观众群,在搜索引擎上搜索而被正确导引至该站。

在该站点增加相当数量的原创内容。
使用合理大小、准确描述的汇标,而不过度使用关键字、惊叹号、或不相关标题术语。

确认所有页可通过正常的链接来访问,而非只能通过Java JavaScriptMacromedia Flash应用程序访问。这可通过使用一个专属列出该站所有内容的网页达成(网站地图)

通过自然方式开发链接:Google不花功夫在这有点混淆不清的指南上。写封电子邮件给网站管理员,告诉他您刚刚贴了一篇挺好的文章,并且请求链接,这种做法大概很可能为搜索引擎所认可。

参与其他网站的网络集团(译按:web ring 指的是有相同主题的结盟站群)──只要其它网站是独立的、分享同样题目、和可比较的品质。

 

黑帽方法
主条目:垃圾索引和斗蓬法
垃圾索引(Spamdexing)意指通过欺骗技术和滥用搜索算法来推销毫不相关、主要以商业为着眼的网页。许多搜索引擎管理员认为任何搜索引擎优化的形式,其目的用来改进网站的页排名者,都是垃圾索引。然而,随时间流逝,业界内公众舆论发展出哪些是哪些不是可接受的、促进某站的搜索引擎排名与流量结果的手段。

因为搜索引擎以高度自动化的方式运作,网站管理员通常可以利用某些未被搜索引擎认可的手段、方法来促进排名。这些方法经常未被注意除非搜索引擎雇员亲临该站点并注意到不寻常活动、或在排名算法上的某个小变化导致站点丢失以过去方式取得的高排名。有时某些公司雇用优化顾问评估竞争者的站点、和"不道德的" 优化方法向搜索引擎报告。

垃圾索引经常与合法的、不介入欺骗的搜索引擎优化技术搞混。垃圾索引专注于让该网站得到更多的曝光率,而非他们选用的关键词,这导致令人不满的搜索结果;相对的,优化则专注于他们希望得到的排名,基于特定目标关键字上;这导致令人满意的搜索体验。

当这些不好的垃圾索引被发现时, 搜索引擎也许会对那些被发现使用不道德的优化手段者采取行动。在2006 2月,Google拿掉了BMW 德国站和Ricoh 德国站,因为他们用了这些方法[15]

斗蓬法(cloaking)简单来讲就是网站站长用了两版不同的网页来达到最佳化的效果。一个版本只给搜索引擎看,一个版本给人看。搜索引擎说这种做法是不正规,如发现,该网站会永远从搜索引擎名单中被剔除[16]

关键字隐密字 (hidden text with keyword stuffing) 是另外一欺骗搜索引擎的做法。通常是指设置关键字的颜色和网页背景颜色一样,或通过 css hidden attribute (隐密特性) 来达到优化效果。这种做法一旦被Google发现,遭遇也会是该网站从Google的数据库中除名[17]

 
搜索引擎优化(Google SEO)与营销
当这篇文章倾向建立间的搜索引擎优化师间戴哪种颜色帽子的区别,这些产业写照实际上对于某些促成业界某些影响巨大成就部分的工作者着墨不多。

有相当多的优化实践者只是认为把搜索引擎当作该站的另一个访客,并设法让该站点亲和如同真正访客拜访那些网页一般。他们的工作焦点不集中于将许多术语于搜索引擎排名最高,而是帮助站点拥有者达到该站点的商业目标。这也许以实现导引基本搜索结果、甚或利用在搜索引擎做有偿广告的形式到某些页。至于其他页,建立高品质网页吸引参与和说服,阐明技术问题,这些手段可让搜索引擎继续爬过并检索这些站。另,设置分析程序可以让网站主衡量该网站成就,并且让该站更亲和更有用。

这些搜索引擎优化员可能是某组织的一员,或者是个顾问,而搜索引擎优化也许只是他们每天例行工作的一部分。通常他们有关搜索引擎功能的知识来自于论坛、博客、一般的会议和研讨会间的交互和讨论主题、甚或经由在他们自己的站点实验获得。目前极少的大学课程涵盖电子交易观点的网上营销,可能肇因于网络上一日数变的关系。

当许多人检阅和致力于符合搜索引擎指南时──这可帮助某人于网络上的成功打造坚实基础──跟随这些指南的结果实际上不过只是个开始。许多人认为搜索引擎营销不过是个搜索优化下较大一点的支部而已,但它可能是许多主要集中于搜索引擎优化的老兵,集合了更多更多的营销灵感所带来的成就。搜索引擎因为认知到这一点,他们扩展了搜索引擎覆盖面,包括了RSS提供元、录影搜索、地方结果、地图、和更多他们必须提供的功能。

法律案例
2002
年, 搜索引擎操作者SearchKing在俄克拉何马法院提出了诉讼,反对搜索引擎GoogleSearchKing的要求是, Google防止垃圾索引的手段构成了一条不公正的商业惯例。这也许可想像为垃圾电子邮件营销者控告反垃圾电子邮件者,如同许多反对地图以及其他DNS黑洞表(DNSBL)的案例。20031月,法院发布了一个Google胜诉的判决摘要[18]

高品质网站通常排名很好
对许多有心于最大化网站附加价值的网站管理员们,可阅读由搜索引擎出版的、以及W3C发行的编码指南。如果该指南被遵循,站点频繁地更新,有用、原创的内容,和建立几个实用、有意义的导入链接,获得相当可观数目的基本搜索流量不是什么难事。

当站点拥有有用的内容,其它站点员自然而然会链接至该站,进而增加访客它的网页级别和访客流。当访客发现一个有用的网站,他们倾向于利用电子邮件或者及时消息链接介绍给其它访客。

总括来说,增进网站品质的搜索引擎优化实现很可能比直接查找操控搜索排名手段的短期实现要活得长久。顶尖的搜索引擎优化员们找寻的目标与搜索引擎追求发扬光大的东西二者不约而同。他们是:相关性、对他们用户有用的内容。

 

 

 

上一篇:利用百度贴吧带来流量外链的方法

下一篇:中小企业如何做好百度推广

关于广闻 | 联系我们 | 诚聘英才 | 业务合作 | 留言反馈 | 旗下网站:商机中心SEO论坛SEO培训

联系电话:15858801431、13736903517,QQ:569588500346850018 |