什么是做到网?关于寻源方法通常情况下包含这三个步骤

qinzhiqiang 10-16 16:10 789次浏览

开始之前,先了解下什么是“平行网页寻源”?这个很关键,在做之前,起码要知道这个项目是要求你做什么的,因为在平台交流版块,每次都会看到新人在询问这个问题,不知道要做什么。

"做到网"平行网页寻源技巧经验分享

关于寻源方法,通常情况下包含如下三个步骤:

第一步:找到多语言网站主站url

第二步:这个主站至少包含2个语言分站url

第三步:抽取每2个语言分站下内容互译页面url

不难理解,其实就是找网页,支持多种语言的那种网页,然后,将有互译内容的网页面的URL提取出来即可。

知道了这个项目的玩法后,下面就是如何去寻找支持多语言的网页了,不同的人,可能有不同的方法,但是,这个方法很关键,掌握方法了,可以让你又快,又准的找到这种网页。方法不当,就犹如大海捞针。

其实,细心一点,你会发现任何网页的URL都不是随意设置的,都是经过一番考虑,有一定用意的,并且URL链接与网页的内容有着一定的相关性,所以,其实我们完全可以利用这种相关性,来缩小范围,快速准确地找到所需要的。

下面就是我个人在做寻源项目时,摸索到的一些方法:

(1)了解常用的各国域名后缀,即不同国家URL后缀命名方法;

(2)使用搜索引擎工具;

各国域名采用的后缀,可以在百度上查找到,以较为常见的语言为例,语言与后缀名对应如下:

中国:CN,美国:US, 英国:GB, 西班牙:ES, 俄罗斯:RU,法国:FR, 日本:JP,韩国:KR,越南:VN,泰国:TH, 土耳其:TR,葡萄牙:PT,印度尼西亚:ID,阿拉伯:AE,

清楚了不同国家URL后缀命名方法,剩下的事情,就交给搜索工具吧,让它去帮你检索你想要的网页。这件事度娘可能帮不到你了,我们要借助于谷歌Google或者谷歌变种的一些搜索引擎。 当然,使用搜索引擎工具,也是有一定技巧在里面的。这些技巧,在搜索关键字时,配合一些通配符,可以帮助你快速检索到想要的结果。上面提到的技巧,比如inurl的使用。

inurl是谷歌等搜索引擎支持的高级语法,它的作用是限定在URL(地址栏里的内容)搜索,比如:URL中包括xxx,则我们可以在谷歌中搜索“inurl:xxx”。

下面以谷歌为例,介绍如何使用谷歌检索的技巧以及各国域名后缀,能够快速检索到一类网站,供你进行筛选。

例如,我现在要找一些西班牙语的网站,同时,这些网站也要支持英语,然后从这类网站中去筛选,看是否满足“平行网页寻源”的要求。

"做到网"平行网页寻源技巧经验分享

搜索到的结果:

"做到网"平行网页寻源技巧经验分享

从检索出的结果可以看到,URL中都包含有我们的关键词“es/en”,打开任意一个URL,

"做到网"平行网页寻源技巧经验分享

把上述的URL中的“en”去掉,

"做到网"平行网页寻源技巧经验分享

经过上述对比,这对网页满足“平行网页寻源”的要求,我们可以继续下一步在平台上验证该主站是否存在,如果不存在,那么我们就可以提交了,提交后,一旦采纳,我们会有2元的基础价格收入,如果找到的源是属于优质源,则后期会有30~320元更高的价格补贴。

简单的总结了平行网页寻源的方法,希望这篇文章可以帮助有需要的朋友。

  • 暂无推荐