文章转载自:http://www.cnblogs.com/swtseaman/archive/2011/04/28/2031572.html
2009年03月09日 星期一 下午 06:03
sqlServer本身并没有提供随机读取记录的功能,但我们可以通过一些方法来实现这个目的。本文介绍了其中几种方法并比较了各自的优劣。
方法一:
直接通过sql语句实现,如:
- select top n * from tableA order by newid()
这是最简单的方法,通过调用sqlServer的newid()函数(产生GUID—全局唯一标志符)来产生随机记录。
采用这种方法时,需要将表中所有记录与newid()生成的值进行比较从而进行排序。因此,如果表中的记录较多,操作会非常缓慢。
方法二:
假设表中有一个自增长主键,增量为1。这时我们可以这样处理,取出主键的边界值(最大值和最小值),然后通过一个算法得到介于(包括)两个边界之间的随机值,最后按照这个值取出对应记录。下面是C#的例子:
这种方法较前一种方法的操作速度有了较大提高(特别是在大数据量的情况下)。但只有当主键值是连续的,中间没有断开的情况,并且增量为1时才能用这种方法。那么,如何才能解决这个问题呢?请继续往下看。
方法三:
对方法二进行了改进。主要思路是,将表中所有的主键值读进一个数组,从数组中随机读出一个值,按照这个值取出对应记录。下面是C#的例子:
- //将主键值读进ArrayList
- ArrayList DataIndex = new ArrayList();
- while (sdr.Read()) //sdr为存放所有主键值的sqlDataReader
- {
- DataIndex.Add(sdr[0]); //存入ArrayList
- }
- //从ArrayList中随机读取数据项
- Random rand = new Random();
- int num = Convert.ToInt32(DataIndex[rand.Next(DataIndex.Length)]);
- //读取记录的sql字符串
- string sqlStr = "select * from tableA where PK = " + num;
这样不管主键是否为自增长字段,也不管数值是否连续,都能够应付自如了。经过笔者的测试,在数据量为50万的情况下代码运行速度几乎没有受到什么影响,可见ArrayList的操作性能是可以信赖的。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。