您的位置:首页 > 编程语言 > Go语言

如何写一个像btgoogle一样的12306泄露数据查询

2014-12-26 22:39 369 查看
demo地址:http://www.btgoogle.com/12306/

圣诞节,12306送给了我们一个大礼物。大约 14w的数据泄露, 看网上都沸沸扬扬的。开始也准备找一个数据库来看看,随后,我 得到了 一份 数据 大约 14M 也就是

143,863 个数据


.文件泄露的是 txt 格式的文件。 当群里有人也得到了这份数据。准备做一个 12306泄露的数据库做一个网站。提供他人查询自己是否在此次泄露信息的名单中。

信息是这种形式的



当时群里,有人开始比速度,程序员都好面子~~~

有人说 5分钟搞定。 过了 差不多 5-10分钟 。确实搞定了。

他的方法是 利用正则匹配 本地文件,然后网站内 通过get 获取email 然后正则匹配到 输出 已泄露。

1 <?php
2
3 $email = $_GET["email"];
4
5 $L = preg_split("/\n/", file_get_contents("12.txt");
6
7 foreach($L as $c) {
8     if (preg_match("/{$emaul}/", $c)) {
9             echo "已泄露";
10             break;
11     }
12 }


  呵呵 ,呵呵 ,这样确实是把这个处理掉了。这是比的速度。

但是 ,我们还是一步一步的处理数据然后入库,随后查询吧。一共是 14w多数据,开始还考虑使用 sphinx ,显然是没有必要的。



速度不错 。开始准备在这个下面用

order by rand() limit 50

获取 随机的 50个用户的信息。使用 这段语句每执行一次 需要 6秒多,确实很耗时间,随后,网站也崩溃了一段时间。

下面是 遇到同样困扰的处理。

*****************************************************************

sql order by rand随机数据优化与性能对比
来自:http://www.111cn.net/database/mysql/53036.htm

最初使用的是 order by rand()了,发现几万条数据居然要10秒之长的时间很是悲剧吧

代码如下复制代码
SELECT * FROM `表名` order by rand()

显示行 0 - 29 (154,825 总计, 查询花费 10.1125 秒)

后来网上搜索到如下方法,同样数据感觉有很大的提高了(这里测试的是15W数据)

代码如下复制代码
SELECT * FROM 表名 WHERE id >= ((SELECT MAX(id) FROM 表名)-(SELECT MIN(id) FROM 表名)) *

RAND() + (SELECT MIN(id) FROM 表名) LIMIT 10

显示行 0 - 29 (154,825 总计, 查询花费 0.0221 秒)

感觉不错了,有朋友说用join可能更好,于时找了一段代码测试一下查询花费 0.0025 秒,又提供了几倍呀。

代码如下复制代码
SELECT *
FROM 表名 AS t1
JOIN (
SELECT ROUND( RAND( ) * (
SELECT MAX( id )
FROM 表名 ) ) AS id
) AS t2
WHERE t1.id >= t2.id
ORDER BY t1.id ASC
LIMIT 10

显示行 0 - 9 (10 总计, 查询花费 0.0025 秒)

最后还可以优化一下

代码如下复制代码
SELECT s_url,title
FROM 表名 AS t1
JOIN (
SELECT ROUND( RAND( ) * (
SELECT MAX( id )
FROM 表名 ) ) AS id
) AS t2
WHERE t1.id >= t2.id and t1.z_type = $z_type ORDER BY t1.id asc LIMIT 10

显示行 0 - 9 (10 总计, 查询花费 0.0008 秒)

总结一下,我们如果用同样的方法在字段选择时越少越好,这不从0.0025直接降到0.0008秒了哦。

*****************************************************************************************************



后面把这一部分使用了 html 静态的了。

随后你需要处理这个文件,处理到数据库中,这里我用的是mysql 。对于字符串的处理,直接用编辑器 自带的正则匹配掉就行了 。

———— 很容易发现很多 这种形式 直接全部替换成 ‘,’ 这种形式,每个前面 后面也需要添加相应的字符。^ 匹配开头 $ 匹配结尾。





存储了数据 后面就是直接 使用php 前端直接查询输出了。

下面是关键代码。

$email=$_GET['s'];
$q = "SELECT * FROM `user` WHERE email='$email'";
$r = @mysqli_query($dbc, $q);
echo '<h1>您邮箱搜索的结果:</h1>';
echo "<p>输入您的邮箱查看是否露出了您的数据</p>\n";
echo '<table align="center" cellspacing="3" cellpadding="3" width="75%">
<tr><td align="left"><b>邮箱</b></td><td align="left"><b>密码</b></td><td align="left"><b>身份证</b></td><td align="left"><b>用户名</b></td><td align="left"><b>手机号</b></td></tr>
';
while ($row = @mysqli_fetch_array($r, MYSQLI_ASSOC)) {
$emails=$row['email'];
echo '<tr><td align="left">' . $row['email'] . '</td><td align="left">' .'***'.substr($row['password'],3) . '</td><td align="left">' .'*****'. substr($row["id_card"],5) . '</td><td align="left">' . $row["user"] . '</td><td align="left">' . '***'.substr($row["phone"],3) . '</td></tr>
';
}
if($emails==null){
echo '<h4 style="color:red">恭喜您!您的数据没有露出!把好运分享给你的好友吧!<h4>';
}
else{echo '<h4 style="color:red">您的数据已经露出,请及时修改密码!分享给你的好友,看看他们有没有露出数据哦!<h4>';}
echo '</table>'; // Close the table.


  demo地址:http://www.btgoogle.com/12306/
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: