实现汉字的凯撒密码(内容包括:去掉字符串中的转义字符、汉字的unicode转换)
2016-10-31 22:49
483 查看
实验内容:
选择合适的秘钥,利用上述三个算法:熟悉恺撒密码、双重置换密码、一次一密密码算法。加密如下明文:
大风起兮云飞扬,
威加海内兮归故乡,
安得猛士兮守四方。
《大风歌》--刘邦
3.1.1凯撒密码
凯撒密码作为一种最为古老的对称加密体制,在古罗马的时候都已经很流行,他的基本思想是:通过把字母移动一定的位数来实现加密和解密。明文中的所有字母都在字母表上向后(或向前)按照一个固定数目进行偏移后被替换成密文。
例如,当偏移量是3的时候,所有的字母A将被替换成D,B变成E,以此类推X将变成A,Y变成B,Z变成C。由此可见,位数就是凯撒密码加密和解密的密钥。
我对“怎么用凯撒密码加密一句中文”产生了疑问,实际上解决方法可以有很多种,例如用数组中不断地“大、风、方……”这些词的简单位移,事实上经过搜索,我选择了使用unicode的变换来完成。
即,可以用汉字对应的字符码来进行变换操作,这样出来的还是汉字。比如汉字“一”的unicode是0x4e00,凯撒移位为1的话0x4e00+1=0x4e01,对应的汉字是“丁”,如果移位为三,就是0x4e03,对应汉字是“七”。
主要算法:
思路:将汉字范围内的整型转换为16进制字符串作为后缀,前面加入\u,形成对应的unicode值。
这段代码并不复杂,遇到的问题在于:
当我在main函数调用时,注释掉的该行(如下)不能够实现我把转义字符\去掉,即最后输出的是\u593a这种形式,而非unicode值对应的“太”。
//System.out.println(stringResult.replace("\\","\");
苦思冥想了很久,在这篇博文中得到了启发:《java中如何忽略字符串中的转义字符》,(http://www.cnblogs.com/davidwang456/p/4580786.html)他与我遇到了相似的问题:只要把得到的报文中的“\”换成“\”,我想就能正常地将Unicode输出成中文了,首先想到的是使用字符串的replaceAll()方法。使用replaceAll(“\\“,“\“),但是发现输出结果没有任何变化。
解决方法是:查了下API文档,replaceAll()方法的定义是:public String replaceAll( String regex,String replacement) ;也就是第一个参数指的是正则表达式,所以“\\”用正则表达式的方式来看,匹配的是字符串中的两个\字符,而不是java中的‘\’转义符。换句话说,就是regex参数作为正则表达式查找的源字符串是已经转义过的“\u79fb\u52a8\u4e92\u8054\u7f51\u5e94\u7528”,而不是转义前的“\\u79fb\\u52a8\\u4e92\\u8054\\u7f51\\u5e94\\u7528”,所以replaceAll(“\\“,“\“)自然没效果了。后来在StackOverFlow上找到一个忽略转义的工具类,
于是我下载了工具包并导入
因此得到了运行结果:
古典密码恺撒密码、双重置换密码、一次一密密码算法三种都写了,但是实验报告搞过来太麻烦,图片要一个一个贴,等这一阵考完雅思把报告打包一下传上来。
选择合适的秘钥,利用上述三个算法:熟悉恺撒密码、双重置换密码、一次一密密码算法。加密如下明文:
大风起兮云飞扬,
威加海内兮归故乡,
安得猛士兮守四方。
《大风歌》--刘邦
3.1.1凯撒密码
凯撒密码作为一种最为古老的对称加密体制,在古罗马的时候都已经很流行,他的基本思想是:通过把字母移动一定的位数来实现加密和解密。明文中的所有字母都在字母表上向后(或向前)按照一个固定数目进行偏移后被替换成密文。
例如,当偏移量是3的时候,所有的字母A将被替换成D,B变成E,以此类推X将变成A,Y变成B,Z变成C。由此可见,位数就是凯撒密码加密和解密的密钥。
我对“怎么用凯撒密码加密一句中文”产生了疑问,实际上解决方法可以有很多种,例如用数组中不断地“大、风、方……”这些词的简单位移,事实上经过搜索,我选择了使用unicode的变换来完成。
即,可以用汉字对应的字符码来进行变换操作,这样出来的还是汉字。比如汉字“一”的unicode是0x4e00,凯撒移位为1的话0x4e00+1=0x4e01,对应的汉字是“丁”,如果移位为三,就是0x4e03,对应汉字是“七”。
主要算法:
//凯撒加密算法(简单替换密码),传入明文字符串,返回一个密文字符串 public static StringBuilder chineseToUnicodeAddThree(String str){ //static类方法 String result=""; for (int i = 0; i < str.length(); i++){ int chr1 = (char) str.charAt(i); if(chr1>=19968&&chr1<=171941){//汉字范围 \u4e00-\u9fa5 (中文) chr1 += 3; String hexLastUnicode = Integer.toHexString(chr1); result += "\\u" + hexLastUnicode; } else{ //非汉字范围(直接打印出来吧,例如:句号,感叹号。此处不再做unicode的转变) result+=str.charAt(i); } } StringBuilder strBuilder = new StringBuilder(result); return strBuilder; } |
这段代码并不复杂,遇到的问题在于:
当我在main函数调用时,注释掉的该行(如下)不能够实现我把转义字符\去掉,即最后输出的是\u593a这种形式,而非unicode值对应的“太”。
//System.out.println(stringResult.replace("\\","\");
苦思冥想了很久,在这篇博文中得到了启发:《java中如何忽略字符串中的转义字符》,(http://www.cnblogs.com/davidwang456/p/4580786.html)他与我遇到了相似的问题:只要把得到的报文中的“\”换成“\”,我想就能正常地将Unicode输出成中文了,首先想到的是使用字符串的replaceAll()方法。使用replaceAll(“\\“,“\“),但是发现输出结果没有任何变化。
解决方法是:查了下API文档,replaceAll()方法的定义是:public String replaceAll( String regex,String replacement) ;也就是第一个参数指的是正则表达式,所以“\\”用正则表达式的方式来看,匹配的是字符串中的两个\字符,而不是java中的‘\’转义符。换句话说,就是regex参数作为正则表达式查找的源字符串是已经转义过的“\u79fb\u52a8\u4e92\u8054\u7f51\u5e94\u7528”,而不是转义前的“\\u79fb\\u52a8\\u4e92\\u8054\\u7f51\\u5e94\\u7528”,所以replaceAll(“\\“,“\“)自然没效果了。后来在StackOverFlow上找到一个忽略转义的工具类,
org.apache.commons.lang.StringEscapeUtils ,里面有忽略各种语言的转义符号的方法,既好用也便于理解,就直接拿来用了。 其中unescapeJava(String s)方法是来处理java转义字符的,可以将字符串中的 “\”转换为 “\”,“'”转换为“'”等。通过这个方法处理以上字符串,刚好能够满足我的需求。
于是我下载了工具包并导入
,这还是我第一次导入eclipse工具包的体验。对我的main函数进行了修改,最后得以运行。
public static void main(String[] args) { String str = new String("大风起兮云飞扬,威加海内兮归故乡,安得猛士兮守四方!——《大风歌》刘邦"); StringBuilder result = experiOne.chineseToUnicodeAddThree(str); //调用加密方法进行加密 String stringResult = new String(result); //System.out.println(stringResult.replace("\\","\"); String r = StringEscapeUtils.unescapeJava(stringResult); System.out.println(str); System.out.println(r); } |
值得注意的是,除了上述错误耽误了较久的时间,在十六进制加3的时候也遇到了问题。根据unicode编码已知,
a283在“大”这个字应该为\u5927,我需要对后面的十六进制数字5927进行+3的数字运算,这里走了不少弯路。
首先对\u5927字符串直接加三,这显然是不行的。之后对String 类型的5972进行加3,发现结果变成了59273(String类型后面’+’只能进行字符串的后缀叠加)。反思后,我把String类型先parseInt变为Int型再加3,这下肯定不会出错了吧?结果发现例如”风”是\u98ce,不能进行parseInt的转换。
此刻我的内心是崩溃的,“怎么进行十六进制加法,还要忽略字符串?”这个问题纠结了很久。最后,解决方案是:在没转成16进制之前,对,就是在十进制的时候就加3,然后再转成16进制。(因为16进制的3和10进制的3是一样的)。
因此得到了运行结果:
虽然凯撒密码是本次实验中入门的古典密码,但是从“单字母表替换”到“char数组的位移替换”到“利用unicode码”我认为难度是不一样的,从这个过程中我学到了很多东西。
----------------古典密码恺撒密码、双重置换密码、一次一密密码算法三种都写了,但是实验报告搞过来太麻烦,图片要一个一个贴,等这一阵考完雅思把报告打包一下传上来。
相关文章推荐
- C#实现将汉字与英文字符混和字符串中的汉字转换为拼音
- js把预定义的html字符串转换为 HTML 实体 htmlspecialchars 输出html实体内容包括标签,而不自动转义标签,只显示内容,类似php的htmlspecialchars
- java:实现字符串到二进制字符、16进制字符、unicode字符、base64字符之间的转换
- PHP的strtolower()和strtoupper()函数在安装非中文系统的服务器下可能会导致将汉字转换为乱码,请写两个替代的函数实现兼容Unicode文字的字符串大小写转换
- Java String字符串和Unicode字符相互转换代码(包括混有普通字符的Unicode)
- C#实现将汉字与英文字符混和字符串中的汉字转换为拼音
- 转换输入字符串中的任何转换(转义)字符
- UTF-8与Unicode字符的相互转换 与 16进制Unicode转换汉字 重用代码
- 将用户输入的字符串转换为可换行、替换Html编码、无危害数据库特殊字符、去掉首尾空白、的安全方便代码
- C#中将UNICODE编码后的字符转换为汉字
- 去掉字符串中特定字符,然后转换成整型
- hoj10240----包括汉字字符的字符串逆置
- 转换输入字符串中的任何转换(转义)字符
- ORACLE_从字符串中提取汉字(不包括全角符及日文韩文等字符)
- SSH中转义特殊字符串以及非Web项目中的特殊字符转换
- @V@ java代码笔记2010-06-12:java控制台输入各类型类实现;以及判断输入字符串里面是否有数字的两种方法:方法1:转换成字符数组;方法2:正则表达式。
- JavaScript 实现字符与unicode编码的相互转换
- 汉字转换成Unicode,简单的java实现方法
- 去掉一个字符串中的$符号以及大括号中的字符(包括大括号)。
- C/C++ 各种字符编码字符串的转换 可用于XML文件的字符转化读写 (收集 GBK - UTF8 - Unicode - ANSI )