熟悉百度的站长都知道,凡是被百度搜索引擎收录的网站链接,都会生成一个以baidu开头的多参数跳转链接,而所谓「百度反推技术」的原理就是把百度生成的这个链接地址换成自己想要被收录的页面链接就可以了,然后再进行百度快照的投诉,就可以达到秒来蜘蛛,页面合格或域名权重可以的情况下,可以达到秒级收录从而达到百度秒收的效果。
思路模型:伪造百度url后面的加密信息(https://www.baidu.com/link?url=xxx)
x代表加密的网址信息,然后我们可以访问这条url,实现模拟点击,使他在百度有一次缓存记录,从而达到收录。
案例分析:首先百度搜索结果的每个链接上都添加了onmousedown,看来也是用来进行统计的。有SEO算法研究专家解释说onmousedown属于HTML DOM语法,意思是:事件会在鼠标按键被按下时发生执行。常用于JS事件中。
这一串URL代表的是地址,然后将链接贴入到地址栏,用Fiddle抓包看下跳转的代码。
fiddler抓包结果
GET https://www.baidu.com/link?url=H2O44BHPqQ8lZgy0ckP2iAB8WlBCty4TfLNHg1zHXlg-4fX5Sku_OOJ4DuNSceWQx-yhfaaAdaWWZpXmHZDBYa&wd=&eqid=91cb2812000081b7000000065ef6c4b1 HTTP/1.1
Host: www.baidu.com
User-Agent: Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:77.0) Gecko/20100101 Firefox/77.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
Accept-Language: zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2
Accept-Encoding: gzip, deflate, br
Upgrade-Insecure-Requests: 1
Connection: keep-alive
Cookie: RT="sl=1&ss=kbx3wbje&tt=jm&bcn=https%3A%2F%2Ffclog.baidu.com%2Flog%2Fweirwood%3Ftype%3Dperf&z=1&dm=baidu.com&si=91xj9kyqurg&ld=dbq&ul=114un&hd=114z6"; BDSFRCVID=L4-OJeC62uf_w7QuPZfquld3A2a973bTH6ao8fJCcxW8t5LqfMT1EG0P_U8g0Ku-S_L1ogKK3gOTHxDF_2uxOjjg8UtVJeC6EG0Ptf8g0f5; H_BDCLCKID_SF=tb4f_K_KJCt3HRb6qRJqMJ0qMmT22-usK-jJ2hcH0KLKfnLRDUbC5f6yWaoa25QR3IIO-nRstMb1MRjv26J8D-CV3H3etpRianneKh5TtUJ6eCnTDMRh-6FYht6yKMnitKv9-pny3pQrh459XP68bTkA5bjZKxtq3mkjbPbDfn02eCKuDjtBjTOBDHus5-70KK0X3RRVM45_KROvhjRh5xAgyxomtjD82er70braBqTdqt51X6tWQp_TDGJILUkqKCO20fJhyUbjsnT4qf8b0hJQQttjQPRhfIkja-5tQqIKKJ7TyU45bU47yh7R0q4Hb6b9BJcjfU5MSlcNLTjpQT8r5MDOK5OhJRLDoIPhtI0hhKv65nt_MRLDMfTMetJyaR3jbxJvWJ5TMCo1bxcV5h_0X4r-LnQQBJkO_-JD3MI5ShPC-tnj25-Y2arPBqQbfR6T0hn93l02Vhbae-t2ynQDbnPtt4RMW20e0h7mWPnUsxA45J7cM4IseboJLfT-0bc4KKJxbnLWeIJEjjChj6JWjaAHqbbfb-otBJTaMRK_Hn7zePR2Lf4pbt-qJtrjy66u_-5xyJQkfJRgDULKDCuID4nnBT5Kab-jL4JxJh3_S-Qqbh-5j4_kQN3TQMuO5bRiL66XBD5kDn3oyTbJXp0n2-Oly5jtMgOBBJ0yQ4b4OR5JjxonDh83bG7MJPKtfJCe_K85tID3fP36q60bj6FVbhQXetJyaR3r_T6vWJ5TMCoGblnbjp_00b6hbRQQ5n7CoJDXJKODShPC-tPWbxId-p7Uqn0tBT6h2x-h3l02VM7ae-t2ynQD0nnrJ4RMW20e0h7mWPnUsxA45J7cM4IseboJLfT-0bc4KKJxbnLWeIJIjj6jK4JKDNLDJ6OP; H_PS_PSSID=1443_31326_21083_32139_22160; SIGNIN_UC=70a2711cf1d3d9b1a82d2f87d633bd8a03431633388; delPer=0; BD_CK_SAM=1; PSINO=7; BAIDUID=093299B17B2327F6E4A1E499E457BA6D:FG=1; BDUSS=s9i0dqvgkmp4p89vc8n9j4n3v7; BIDUPSID=053A1D1CBB06A5C20A545102F1378576; PSTM=1593228400; BD_HOME=1; BD_UPN=13314352; H_PS_645EC=088ep8t6bOKdbc8kQ20ARjEh4JZ4vq00xMel2h2Pvj6QXL%2FII61yGxUZwyVzmpffjlAk; BDORZ=FFFB88E999055A3F8A630C64834BD6D0; BDRCVFR[gltLrB7qNCt]=mk3SLVN4HKm; COOKIE_SESSION=14_0_8_9_6_8_0_1_8_4_5_1_67177_0_95_0_1593230609_0_1593230514%7C9%23241369_18_1592966796%7C9; BDSVRTM=0
经过SEO算法专业人士研究问题大致如下。百度对自家产品与普通网站是不同对待的。
百度搜索结果页面分析
百科fm参数是albk 贴吧是altb 新闻是alns 普通网站则是as,我没猜出fm是什么参数,估计是(from)之类用于判断结果类别的。
注:fm 是数据返回的格式(format)
F、F1、F2、F3都不知道是什么参数,本来以为是16进制的ip,转换后发现不对,而且与ip无关,一般是不变的,也有变的,有兴趣可以看下我上面发的,
注:F、F1、F2、F3 是SERP(搜索结果页)的每个结果与查询词对应的记录
T是linux时间戳,title,url就不用说了,p1是排名,y也是未知参数个个不同。
注::T 是服务器返回搜索结果时间(Time),title 是百度给搜索结果链接加的标题(不等同网页标题),url 是搜索结果链接,p1是百度搜索结果当前页全部排名,y不清楚。然后百度又在这2年把p1改为百度阿拉丁开放平台在搜索结果页的排名,用p5代替原先的p1。
百度每个搜索结果都有一个onmousedown事件,谁知道这个具体它在服务器端做什么处理呢!?肯定对排名有影响的,这就不用说了
注:
q 查询词
fm 数据返回的格式
F 查询词与搜索结果标题、描述、链接的匹配方式
F1 似乎是结构化数据
F2 搜索结果链接标题来源
F3 优先级排序(主域名>子域名>详情页)
T 服务器返回搜索结果时间
title 百度给搜索结果链接加的标题(由F2提供)
url 搜索结果链接(由F3提供)
p1 百度搜索结果当前页全部排名
y 不清楚
rsv_sid 样本ID
cid 点击ID
qid 查询ID
t 本地电脑点击搜索结果链接的时间
path 后面的url我已经在 weixingon。com/tool 得到了较好的解决。
wd 关键词
pn 搜索结果偏移量(偏移量offset),用于翻页
rsv_page=1 经过翻页搜索
反向来解读这些代码跟解密码的程度差不多,非常难。那我们换一个思路,只要做一个程序,搜索关键词,然后查找目标网站,找到之后点击,然后在页面随便浏览几个网页,退出,IP切换中,下一个。
通过判断搞清楚了多数参数的含义,但没有明白百度记录那么多真实点击数据是如何影响排名的,seo又能否从中找到哪些提升排名的方式?
现在开始2020百度新算法link?url= BUG深入逆向研究
案例展示:
逆推link?url=加密算法秒收案例
解密url参数代码:
解密url参数代码
逆向加密url代码参考:
逆向加密url代码参考
加密后的URL参数:
http://www.baidu.com/link?url=a3f48d30fc293c5e471ef23de092fddc99fdd688681db1fb62cb8c9daa
本地解密访问反弹效果
http://www.php.net/
其实这个操作的原理很简单,与使用老域名秒收的原理很类似,就是反向解密已被收录页面的链接,再换成希望被收录的页面链接,而且如果把这个功能做成软件,在加上自动切换IP、百度Cookie、自动打码等,还可以实现批量自动化操作达到网站批量秒收录的效果,典型的黑帽玩法!
但是需要注意的是,反推技术秒收录这玩意也不是绝对的,跟所有黑帽手法一样不保证通过这一通操作再提交了链接,就一定被收录,是否收录最终还是要看百度的处理结果,也是水很深哈!
百度收录,一直是站长们最关心的问题,而且这半年很多站长都反应网站收录不稳定,差强人意,虽然一些骚操作号称可以百度秒收,收录暴涨,但是风险站长们也都懂,因此还是建议网站收录还是要跟着百度走,多在网站内容和常规优化上多下功夫,黑帽玩失手了K站就得不偿失了。