python 提取主域名和子域名代码——先根据规则提取，如果有问题，则使用tldextract

import tldextract

def extract_domain(domain):

    suffix = {'.com','.la','.io', '.co', '.cn','.info', '.net', '.org','.me', '.mobi', '.us', '.biz', '.xxx', '.ca', '.co.jp', '.com.cn', '.net.cn', '.org.cn', '.mx','.tv', '.ws', '.ag', '.com.ag', '.net.ag', '.org.ag','.am','.asia', '.at', '.be', '.com.br', '.net.br', '.name', '.live', '.news', '.bz', '.tech', '.pub', '.wang', '.space', '.top', '.xin', '.social', '.date', '.site', '.red', '.studio', '.link', '.online', '.help', '.kr', '.club', '.com.bz', '.net.bz', '.cc', '.band', '.market', '.com.co', '.net.co', '.nom.co', '.lawyer', '.de', '.es', '.com.es', '.nom.es', '.org.es', '.eu', '.wiki', '.design', '.software', '.fm', '.fr', '.gs', '.in', '.co.in', '.firm.in', '.gen.in', '.ind.in', '.net.in', '.org.in', '.it', '.jobs', '.jp', '.ms', '.com.mx', '.nl','.nu','.co.nz','.net.nz', '.org.nz', '.se', '.tc', '.tk', '.tw', '.com.tw', '.idv.tw', '.org.tw', '.hk', '.co.uk', '.me.uk', '.org.uk', '.vg'}

    domain = domain.lower()

    names = domain.split(".")

    if len(names) >= 3:

        if ("."+".".join(names[-2:])) in suffix:

            return ".".join(names[-3:]), ".".join(names[:-3])

        elif ("."+names[-1]) in suffix:

            return ".".join(names[-2:]), ".".join(names[:-2])

    print "New domain suffix found. Use tld extract domain..."

    pos = domain.rfind("/")

    if pos >= 0: # maybe subdomain contains /, for dns tunnel tool

        ext = tldextract.extract(domain[pos+1:])

        subdomain = domain[:pos+1] + ext.subdomain

    else:

        ext = tldextract.extract(domain)

        subdomain = ext.subdomain

    if ext.suffix:

        mdomain = ext.domain + "." + ext.suffix

    else:

        mdomain = ext.domain

    return mdomain, subdomain

print extract_domain("baidu.com")  == ("baidu.com", "")

print extract_domain("www.baidu.com") == ("baidu.com", "www")

print extract_domain("www.xx.com.cn") == ("xx.com.cn", "www")

print extract_domain("www.xxx.gov.cn") == ("gov.cn", "www.xxx")

print extract_domain("abc.www.xxx.net.co") == ("xxx.net.co", "abc.www")

print extract_domain("abcwwwxxx.local") == ("local", "abcwwwxxx")

print extract_domain("abcwwwxxxlocal") == ("abcwwwxxxlocal", "")

print extract_domain("attack/www.baidu.com") == ("baidu.com", "attack/www")

print extract_domain("xx.attack/xxx.baidu.com") == ("baidu.com", "xx.attack/xxx")

print extract_domain("attack/xxx.baidu.com") == ("baidu.com", "attack/xxx")

print extract_domain("xxx.baidu.new_suffix") == ("new_suffix", "xxx.baidu")

print extract_domain("attack/xxx.baidu.new_suffix") == ("new_suffix", "attack/xxx.baidu")

python 提取主域名和子域名代码——先根据规则提取，如果有问题，则使用tldextract的更多相关文章

超详细网站博客域名和二级域名、子域名升级HTTPS免费申请SSL证书配置nginx指南
随着互联网的飞速发展,我们的工作生活已经离不开互联网,HTTP虽然使用极为广泛, 但是存在不小的安全缺陷, 主要是其数据的明文传送和消息完整性检测的缺乏, 而这两点恰好是网络支付,网络交易等网站应用中 ...
php实现单点登录，顶级域名与子域名间共享Cookie实现单点登录原理
这是一个简单版的php单点登录概述,如果需要实现复杂的需自己,编写复杂的ticket加解密算法. 先看张图. sso系统,http://sso.yxh.com 1 2 3 4 5 <?php ...
java 提取主域名
import com.google.common.net.InternetDomainName; public static void main(String[] args) { InternetDo ...
怎么用Python提取域名中的主域名
从一个域名里面提取主域名,初想起来,貌似很简单,不就是数点[.]的个数吗?取最后一个点前后的字符串,那 abc.txt 是域名吗?那再加个验证,加上国家码,.com,.cn,.org结尾的才算,那这个 ...
添加Godaddy二级域名子域名方法
我们在申请注册了Godaddy域名后,如果需要开通二级域名,方法简单只需要在Godaddy添加二级域名(子域名)只要在域名管理后台添加A记录或CNAME别名(Aliases)即可.但我们如果需要添加二 ...
子域名查询、DNS记录查询
目录子域名信息查询 Layer子域名爆破机 subDomainBrute 利用google查询 HTTP证书查询 DNS记录查询脚本 IP转换为经纬度利用网页获取对方经纬度信息首先关于DNS域名 ...
使用python处理子域名爆破工具subdomainsbrute结果txt
近期学习了一段时间python,结合自己的安全从业经验,越来越感觉到安全测试是一个体力活.如果没有良好的coding能力去自动化的话,无疑会把安全测试效率变得很低. 作为安全测试而言,第一步往往要通过 ...
bing搜索引擎子域名收集（Python脚本）
利用bing搜索引擎进行子域名收集,编写了一个简单的Python脚本,分享一下. #! /usr/bin/env python # _*_ coding:utf-8 _*_ import reques ...
Nginx 指定域名（或子域名）和网站绑定
问题起因博主最近在 CentOS 上面部署另外一个网站,但并不想通过端口号来访问,因为端口号对于 SEO 优化不利,且用户访问较繁琐(使用域名不就是为了方便用户访问吗?再引入端口号岂不是和使用域名的 ...

随机推荐

赵雅智_android获取本机运营商，手机号部分能获取
手机号码不是全部的都能获取.仅仅是有一部分能够拿到. 这个是因为移动运营商没有把手机号码的数据写入到sim卡中.SIM卡仅仅有唯一的编号.供网络与设备识别那就是IMSI号码,手机的信号也能够说是通过 ...
通过Src下载图片存到指定目录
string src = temppartsrc + "." + pictype; HttpWebRequest request = (HttpWebReq ...
Android 利用TimerTask实现ImageView图片播放效果
在项目开发中,往往要用到图片播放的效果.今天就用TimerTask和ImageView是实现简单的图片播放效果. 当中,TimerTask和Timer结合一起使用.主要是利用TimerTask的迭代 ...
Python 下的 return 关键字
def make_sum(a, b): return ('+', a, b) >> make_sum(1, 2) ('+', 1, 2) 显示地返回一个元组(tuple),当然 retur ...
Java中Array、List、Set、Map
一.Java中数组数组用来存放固定数量的同类元素,声明方法: T[] ref,T ref[],如int[] intAry; int intAry[].推荐用T[]的方式,后一种方式为兼容C++习惯写 ...
Redis学习笔记（十）命令进阶：事务操作
原文链接:http://doc.redisfans.com/transaction/index.html Redis中也提供了对于事务的支持,由于Redis是单线程处理Client的请求,所以实现起来 ...
备份IIS
备份IIS,这里实质指的是备份IIS配置.如果要备份IIS部署的网站的话,直接Copy目录就行了. 备份IIS配置其实和备份系统含义差不多,为了方便系统或者IIS出现故障后能够及时恢复到某节点上,所以 ...
移动端华为手机 input中placeholder垂直居中失效
为一个app写了一个嵌套的提现页面,效果如下图 input给定宽高,给了line-heigh,在浏览器查看效果正常,placeholder内容以及光标显示都是垂直居中的, IOS显示正常, Andro ...
js通过经纬度计算两点之间的距离
最近这几天在做地图的时候,获取到目的地经纬度和当前所在位置的经纬度,通过这几个参数,用js代码就能获取到这两点之间的直线距离: function (lat1, lng1, lat2, lng2) { ...
子线程创建AlertDialog错误
Can't create handler inside thread that has not called Looper.prepare()

python 提取主域名和子域名代码——先根据规则提取，如果有问题，则使用tldextract

python 提取主域名和子域名代码——先根据规则提取，如果有问题，则使用tldextract的更多相关文章

随机推荐

热门专题