设为首页 - 加入收藏 - 网站地图 SecYe安全 Www.SecYe.Com - 国内网络信息安全IT技术门户网
当前位置:SecYe > 网络编程 > Python > 正文

利用Python对网站进行信息收集

时间:2017-02-09 10:47 来源:bugbank.cn 作者:DZiY 阅读:

因为平常测试每次都要上站长之家查询觉得比较麻烦,所以写了个程序将这些功能放在了一起


 

直接上代码


 

# -*- coding:utf-8 -*-
import requests
import bs4

def getIP(www):
    url = 'http://ip.chinaz.com/?ip=' + www
    response = requests.get(url)
    html = response.text

    soup = bs4.BeautifulSoup(html, 'html.parser')
    content = soup.find_all('p', {'class': 'WhwtdWrap bor-b1s col-gray03'})
    print type(content)
    print content

def getBR(www):

    url = 'http://rank.chinaz.com/?host=%s&sortType=0&page=1' % (www)
    response = requests.get(url)
    html = response.text

    soup = bs4.BeautifulSoup(html, 'html.parser')
    content = soup.find_all('div',{'class':'RePBasic bor-b1s'})
    print content

def getCIP(www):

    url = 'http://dns.aizhan.com/%s/' % (www)
    response = requests.get(url)
    html = response.text

    soup = bs4.BeautifulSoup(html, 'html.parser')
    content = soup.find_all('td', {'class': 'dns-links'})
    print content

if __name__ == '__main__':
    www = raw_input('请输入要查询网站:')
    print '该网站IP信息:'
    getIP(www)
    print '----------------------------------------------'
    print '该网站BP信息:'
    getBR(www)
    print '----------------------------------------------'
    print '该网站同IP网站信息:'
    getCIP(www)
    print '----------------------------------------------'
    print '子域名搜索:'
    print 'http://bugbank.cn/dscan/search.html?domainName=%s' % www[4:]


 

代码写的很 low,主要实现的是IP查询、权重查询、同IP网站查询、子域名查询,感觉whois之类的功能用的蛮少的,要是以后有需要就再加上好了

输出界面如下
好吧,可以看到输出界面还有很多html代码,因为我比较懒,就直接用Beautiful Soul简单抓取了下,感觉自己用可以了,懒得去优化了,有需求的小伙伴可以自己修改


 

由于链接都高亮,所以信息之间分界得蛮清楚的,看着也不是很乱,是吧?


 

PS:IP查询和BR查询用的站长工具、IP反查用的爱站网、最后的子域名搜索直接用的BUGBANK的功能,点链接进到网站查询就可以了


 

PS:PS:现在BUGBANK把新出了一个综合查询,感觉蛮实用了,也不需要登录,小伙伴们可以多试一试~


 

就酱

本文来源:SecYe安全网[http://www.secye.com] (责任编辑:SecYe安全)

点击复制链接 与好友分享!

顶一下
(0)
0%
踩一下
(0)
0%