您的位置:首页 > 其它

List<T>与Dictionary<string,T>频繁检索的性能差距

2015-11-27 10:56 597 查看
  一直对LINQ简洁高效的语法青睐有加,对于经常和资料库,SQL语法打交道的C#开发者来说,LINQ无疑是一个非常不错的选择,当要在List<T>(T为一个普通对象)集合中查找满足某些条件的某个对象时,写成 form t in T where t. Property1 == "A" && t. Property2== "B" …select t或者写成T.Where(t=>t. . Property1 == "A" && t. Property2== "B" …),是再自然不过的了。乍看之下,反正List<T>已被存在记忆体,无需顾忌反复查询所产生的连续成本,而且where条件也十分通俗易懂。但是当你需要频繁检索某个集合中的满足某些条件的对象时,比如需要求两个集合中的差集时,你有没有考虑过性能问题呢?最近的项目遇到频繁检索资料库,对比查询的多个对象的性能瓶颈问题,于是做了下面这个测试,下面我们来看一个对比测试:

public static class LinqOrDictioanry
{
public static string GetLinqSingle(List<Model> model, string id, string sbName)
{
return model.Single(o => o.Id == id && o.SbName == sbName).JuName;
}
public static string GetDictionaryValue(Dictionary<string, Model> dictionaryModel, string id, string sbName)
{
return dictionaryModel[string.Format("{0}\t{1}", id, sbName)].JuName;
}
}


[TestMethod]
public void TestMethod1()
{
var model = new List<Model>();
const int count = 100000;
var time = 3;
var random = new Random(count);
for (var i = 0; i < count; i++)
{
model.Add(new Model()
{
Id = Guid.NewGuid().ToString(),
JuName = "JuName" + random.Next(0, 10000),
SbName = "SbName" + random.Next(0, 10000),
Dydj = "Dydj" + random.Next(0, 10000),
ZhangChang = "ZhangChang" + random.Next(0, 10000),
YcHang = "YcHang" + random.Next(0, 10000),
Time = DateTime.Now,
Total = random.Next(0, 10000)
});
}
var dictionary = model.ToDictionary(d => string.Format("{0}\t{1}", d.Id, d.SbName), d => d);

var toModel = new List<Model>();
var tempCount = random.Next(500, 10000);
for (var i = 0; i < tempCount; i++)
{
var sample = model[random.Next(model.Count)];
toModel.Add(new Model()
{
Id = sample.Id,
SbName = sample.SbName
});
}
Console.WriteLine("Count={0}>{1}", model.Count, tempCount);
for (var i = 0; i < time; i++)
{
Console.WriteLine("第 {0}次检索{1} 个对象", i, tempCount);
var sw = new Stopwatch();
sw.Start();
for (var j = 0; j < tempCount; j++)
{
var model1 = toModel[j];
model1.JuName = LinqOrDictioanry.GetLinqSingle(model, model1.Id, model1.SbName);
}
sw.Stop();
Console.WriteLine("耗时 {0}ms", sw.ElapsedMilliseconds);
Console.WriteLine("查看目标集合中最前面的数据,中间一点的数据,和最后一个数据看是否成功把数据检索出来?{0}, {1}, {2}", toModel[1].JuName, toModel[tempCount / 2].JuName, toModel[tempCount - 1].JuName);
}
Console.WriteLine("");
for (var i = 0; i < time; i++)
{
Console.WriteLine("第 {0}次检索{1}个对象", i, tempCount);
var sw = new Stopwatch();
sw.Start();
for (var j = 0; j < tempCount; j++)
{
var model1 = toModel[j];
model1.JuName = LinqOrDictioanry.GetDictionaryValue(dictionary, model1.Id, model1.SbName);
}
sw.Stop();
Console.WriteLine("耗时 {0}ms", sw.ElapsedMilliseconds);
Console.WriteLine("查看目标集合中最前面的数据,中间一点的数据,和最后一个数据看是否成功把数据检索出来?{0} ,{1} ,{2}", toModel[1].JuName, toModel[tempCount / 2].JuName, toModel[tempCount - 1].JuName);
}
}


View Code
  随机构造一个容量为10万的List<T>集合和Dictionary<string,T>集合,产生一个随机数作为检索的“频率”,也就是在这10万个对象中要检索的次数(这里产生了1639个检索对象),执行结果让人大吃一惊,耗时相差尽然如此之大。



  从测试结果来看,两者的效率天壤之别,而且随着检索集合的容量大小和检索频率成”正比”趋势: 使用LINQ Where检索,执行三次平均检索1600多次13秒左右;而Dictionary执行三次检索1600多次也不超过10ms! LINQ to Object的Where的查询不像数据库可以靠索引加速检索,当查询元素的对象很多,并且查询检索非常频繁时,可以考虑使用Dictionary<string, T>等做法取代Where条件检索,避免不必要的性能损失。

  结论:依赖LINQ的Where查询在大量资料库中频繁检索数据是,很容易形成效率瓶颈。遇到这样的需求,可通过ToDictionary()简单转换成Dictionary,可以获得大幅度的性能提升。

  有人质疑list 转成 dictionary 的时间开销,这里就把本测试的list 转成 dictionary 的时间开销也发出来,





  鄙人能力有限,以上测试纯属个人知识点查缺补漏应用,不敢强加应用场景,以免误人子弟,若有不妥或者错误的地方,还望各位大神斧正。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: