解析抓取时间为汉字格式的(汉字的时间格式转化为数字格式)
2012-08-22 16:06
501 查看
//Regex regexTime = new Regex(@"(?<time>二[\S]+[\u4e00-\u9fa5]+年[\u4e00-\u9fa5]+月[\u4e00-\u9fa5]+日)"); Regex regexTime = new Regex(@"(?<time>二[一二三四五六七八九十〇○O]{3}年[一二三四五六七八九十〇○0]{1,2}月[一二三四五六七八九十〇○O]{1,3}日)"); // string ChineseTime = "二〇〇八年五月二十二日"; try { if (regexTime.IsMatch(TempHTMLContent)) { string ChineseTime = regexTime.Match(TempHTMLContent).Groups["time"].Value; item.CreateTime = DateTime.Parse(ChineseToNumDateTime(ChineseTime)); } } catch { CommonFunction.logWirte("抓取匹配时间出错:源是 " + matchList[i].Value, IWOMWebCrawlerDbLayer.Common.LogGrade.Warning); }
private string ChineseToNumDateTime(string ChineseTime) { string tempTM = string.Empty; Regex regTM = new Regex(@"(?<Y>[\s\S]+?年)(?<M>[\s\S]+?月)(?<D>[\s\S]+?日)"); string tempYear = regTM.Match(ChineseTime).Groups["Y"].Value; tempTM = ConvertTime(tempYear); string tempMonth = regTM.Match(ChineseTime).Groups["M"].Value; tempTM += ConvertTime(tempMonth); string tempDay = regTM.Match(ChineseTime).Groups["D"].Value; tempTM += ConvertTime(tempDay); return tempTM; } private string ConvertTime(string Time) { string num = string.Empty; string n = string.Empty; for (int j = 0; j < Time.Length; j++) { if (j == 0&Time[0].ToString()=="十") { num = "1"; continue; } n = Time[j].ToString(); switch (n) { case "〇": num = num + "0"; break; case "○": num = num + "0"; break; case "O": num = num + "0"; break; case "一": num = num + "1"; break; case "二": num = num + "2"; break; case "三": num = num + "3"; break; case "四": num = num + "4"; break; case "五": num = num + "5"; break; case "六": num = num + "6"; break; case "七": num = num + "7"; break; case "八": num = num + "8"; break; case "九": num = num + "9"; break; case "年": num = num + "-"; break; case "月": num = num + "-"; break; default: break; } } return num; }
相关文章推荐
- 数字日期转化为汉字日期格式
- 数字日期转化为汉字日期格式
- C# 将数字时间转化为特定格式字符串
- Python 如何优雅的将数字转化为时间格式
- java中MessageFormat自动将数字转换成自定格式的字符串 如 45转化成 00045 同样可以转换时间
- 数字日期转化为汉字日期格式...
- 数字日期转化为汉字日期格式...
- 数字日期转化为汉字日期格式
- 数字日期转化为汉字日期格式...
- Oracle中用pl/sql实现货币数字格式到汉字格式的转化
- 数字日期转化为汉字日期格式...
- 数字日期转化为汉字日期格式...
- js 解析java后端的String为json格式并格式化Json格式的时间
- 两位数字金额转化为大写格式
- 站点时间格式的转化
- 日期是NaN 转化成UTC格式时间
- js 正则判断 汉字、数字、英文的格式
- logstash 中将时间转化为带T格式的时间
- Oracle查询Sql语句中的时间格式转化
- Python转非表格格式txt(汉字or数字)为xls