sed解析url的域名
2016-12-19 18:40
465 查看
echo http://3g.163.com/touch/article.html?docid=C6SM5BG40005877U |
sed -n 's/^https\{0,1\}:\/\/\([^\/]*\)\/.*/\1/p'
-n 只输出匹配的行
/p 打印结果
mark:
用反斜杠转义的地方跟普通的正则是反过来的,即表示普通字符不加转义,正则的功能字符需转义;
?表示0或1个不生效。无奈只能用{0,1};
.*? 表示非贪婪模式不生效。例子中用了[^/] 代替
统计域名
cat url_file.txt | sed -n 's/^https\{0,1\}:\/\/\([^\/]*\)\/.*/\1/p' | sort | uniq -c | sort -n -r | awk 'OFS="\t"{print $1,$2}' > domain_sort.txt
后面加上 awk 'OFS="\t"{print $1,$2}' 是为了结果复制到 Excel 方便
sed -n 's/^https\{0,1\}:\/\/\([^\/]*\)\/.*/\1/p'
-n 只输出匹配的行
/p 打印结果
mark:
用反斜杠转义的地方跟普通的正则是反过来的,即表示普通字符不加转义,正则的功能字符需转义;
?表示0或1个不生效。无奈只能用{0,1};
.*? 表示非贪婪模式不生效。例子中用了[^/] 代替
统计域名
cat url_file.txt | sed -n 's/^https\{0,1\}:\/\/\([^\/]*\)\/.*/\1/p' | sort | uniq -c | sort -n -r | awk 'OFS="\t"{print $1,$2}' > domain_sort.txt
后面加上 awk 'OFS="\t"{print $1,$2}' 是为了结果复制到 Excel 方便
相关文章推荐
- 借助微软提供的url重写类库URLRewriter.dll(1.0)实现程序自动二级域名,域名需要泛解析
- 从输入URL到页面加载完成的过程-DNS解析域名过程
- C++ 实现 ping 功能&& 域名(URL)解析实际 IP地址
- C++ 实现 ping 功能&& 域名(URL)解析实际 IP地址
- [Python]从url中解析域名的几种方法
- URL 和 域名解析
- C++ 实现 ping 功能&& 域名(URL)解析实际 IP地址
- python解析URL中的域名
- 域名,网站名,URL解析
- 20110127 学习记录: .net获取当前url各种属性(文件名、参数、域名 等) & 鼠标手型
- 解决维信小程序“URL域名不合法,请在mp后台配置后重试”
- MTK socket 操作之域名解析
- [小技巧] svn: 不能解析 URL
- yii学习笔记--url解析
- 域名的DNS解析指南
- python解析搜狗网页源代码:取搜索引擎返回的前page_num*10个链接的url(待续)
- 收藏一个URL解析的通用方法
- 一个不错的免费二级域名,可以自己解析A记录 CNAME等,而且是备案的域名。
- 借用github 项目主页实现url隐藏转发,绑定域名
- Django中url的逆向解析 -> Reverse resolution of URLs