您的位置:首页 > 其它

以制表符分隔的TXT文件转换成Supermemo可直接导入的文本格式的过程图解

2009-03-31 23:23 816 查看
一直有人问如何将自己的TXT格式的学习材料导入到Supermemo 2006中,经过一晚的试验,最后终于弄通了。
(1) 我的原始文件是一个成语词库,每行前一部分是问题,后一部分是答案,中间有一个制表符分隔



(2) 从网上下载EmEditor文本编辑器软件,我用的是8.04版本,并安装好

(3) 用EmEditor打开原始文本文件,点菜单“Search->Replace...”执行替换功能
在弹出的窗口中勾上“Use Regular Expressions”选项,即使用正则表达式(几年以前写JAVA程序时用过正则表达式,没想到现在用上了)
Find栏内填 (^.*)\t(.*$)
Replace with栏内填 Q: \1\nA: \2\n
注意上面A:的后面有个空格,千万不要丢掉。点“Replace All”,全部替换后的结果如下图:



(4) 设置编辑器
点菜单“Tools->Properties for current configure”,出现如下对话框:
在File选项卡中,点“Saving...”,在“Save Details”对话框中,选中“Save Unicode as HTML/XML Character Reference”。之所以选这款EmEditor编辑器就是因为这个功能,从Google上先查“HTML Escape Character”,后来明白把字符用“&#nnnnn;”表示的方法专业上术语叫做“Numeric Character Reference”,经过一番搜索才找到这款编辑器软件,其它编辑器是否支持这个功能就不太清楚了。



(5) 从File菜单中选择"save as", 在Encoding那个下拉框中选择如下图的那个中欧字符集。就是这个小窗口,害我试了大概1个小时才明白了其背后的道理,也就是说,我们的带汉字的文件放到iso-8859-2这种编码方案中找不到对应的编码时,就会用前面提到的Numeric Character Reference方法来代替。



取好文件名后,点OK,会弹出一个提示窗口,选择最后那个选项,OK



(6) 完成,可以用写字板打开保存后的文件,可以看到汉字都显示成“犹”之类的格式了,就可以完美地导入到Supermemo了



最后生成的成语文本文件可以从 这里 下载。

2010年7月:

无意中看到舍得在2009年12月的一篇文章中使用文字转码工具BabelPad来转换词库,感兴趣者可以试试。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: