微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

IIS日志导入SQLSERVER实例

一直使用URCHIN分析日志,这款google的日志分析工具无论从功能或效率都没的说。

但还是有些特殊的分析需求还是不能完成。因此决定把日志导入到sqlSERVER中进行分析

 

开始想象的比较简单。嵌套一个循环基本可以完成

 

一个大循环读取某文件夹下的所有日志文件

 

里边的小循环逐行读取日志,里边split开来,插入sql即可。

 

根据数据表建立tableadapter ,使用insert存储过程逐条插入数据。

一个问题来了,发现一个日志文件大约200W行需要执行3个小时!!!

效率太低了,开始考虑开启多线程,后来发现执行效率应该和线程无关,主要在tableadapter的插入操作上。

这个插入方法实际上是每次执行连接数据库-插入-断开操作。

 

解决方法是使用内存,少进行IO操作。

先建立一个datatable。 使用tableadapter中的强类型对象初始化这个datatable。

然后将数据读入datatable.

最后使用.net对象中的 sqkbulkcopy 填充数据库

 

这样数据填充的速度问题解决了。几乎200W的数据在5分钟之内可以导完。

 

但实际调试中,第二个问题来了。(一直也没弄明白)

我使用的服务器是2003 64位系统 内存16G。

一个数据文件大概500M,每次填充datatable的时候,一个文件没导完就会报 outofmemory的错误,内存溢出了!!

很奇怪,按说64位的系统应该可以管理很多内存,不存在32为的AWE的问题。

 

于是继续尝试在循环内建立小循环,每次导入datatable 100W 条数据。

导入第一批100W成功了,可循环到第二个100W的时候还是同样的错误

 

代码,每次导入完成之后,我使用table.dispose()清理,可观察资源管理器,内存并没有释放掉。

 

于是使用table.rows.clear()

或者使用table.clear()??

+ GC.collect()

这样基本可以解决内存无法释放的问题,但在实际使用中还是发现内存一直在涨,因为sqlbulkcopy时候sqlserver也会占用很多内存。

少量日志导入应该不会有问题,但不知道连续导入时会出现什么样的情况

 

主要代码

 Private Sub readLogfile(ByVal log As FileInfo)
        Dim reader As StreamReader = New StreamReader(log.FullName)

        While Not reader.EndOfStream

            For j As Int32 = 0 To 1000000
                If Not reader.EndOfStream Then
                    handleLine(reader.ReadLine())
                    i += 1
                    Console.WriteLine(j)
                Else
                    Exit While
                End If
            Next
            bulkcopy(table1)
            'table1.Rows.Clear()
            table1.Clear()
            GC.Collect()

            Console.WriteLine("---------------------------------------------" & i)


        End While

 

 

 Private Sub bulkcopy(ByVal newtable As DataTable)
        Using sqlbulk As sqlBulkcopy = New sqlBulkcopy(Configuration.ConfigurationManager.ConnectionStrings("logAnalysis.My.MySettings.logDBConnectionString").ConnectionString)
            sqlbulk.DestinationTableName = "logDB .dbo.Table_1"
            sqlbulk.BulkcopyTimeout = 108000
            sqlbulk.WritetoServer(newtable)
            sqlbulk.Close()
        End Using

    End Sub

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐