思路
之前在自家OJ测过,但是效果不理想. 然后测一下杭电的,因为网上题解多,所以ac率很高.
来说一下思路,大概就是
模拟hdu上登录
百度上搜索首页的题解
进入blog去正则匹配代码
将代码提交到hdu上
大概就是这4个步骤,为什么需要模拟登录,而不直接发带有PHPSESSID的cookie呢. 我之前把第一个步骤省去试过,发现并不行,只有先登录,让服务器先去认识这个PHPSESSID. 百度上搜索题解,但是发现他的跳转页面是加密的,很难获取真实地址,所以我就把百度快照的地址提取出来. 进入百度快照的地址后,看了一下html代码,发现csdn代码只需要提取pre标签里(name=code,class=html/cpp)的代码就行了,而cnblogs上的代码需要把其中的一些html代码给去除. 所以我干脆直接把每个百度快照的地址中的代码直接提取pre里的代码,不过这样效率不高(可以考虑优化). 最后就是携带cookie去提交代码.
代码
|
|