AI导航网

技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

python – os.walk()缓存/加速

时间：2022-09-01分类：NoSQL作者：编程之家原文地址

我有一个原型服务器[0]正在为客户端[0]进行的每个查询执行os.walk()[1].

我目前正在研究以下方法：

>将此数据缓存在内存中,
>加快查询速度,以及
>希望以后允许扩展到存储元数据和数据持久性.

我发现sql complicated用于树结构,所以我认为在实际提交sqlite之前我会得到一些建议

是否存在可能能够处理此类数据的任何跨平台,可嵌入或可捆绑的非sql 数据库？

>我有一个小的(10k-100k文件)列表.
>我的连接数量非常少(可能是10-20).
>我希望能够扩展到处理元数据.

[0]服务器和客户端实际上是同一块软件,这是一个P2P应用程序,旨在通过本地可信网络与主服务器共享文件,使用zeroconf进行发现,并扭曲几乎其他所有内容

[1]查询时间目前是1.2s,os.walk()在10,000个文件上

以下是我的Python代码中的相关函数：

def populate(self, string):
    for name, sharedir in self.sharedirs.items():
        for root, dirs, files, in os.walk(sharedir):
            for dir in dirs:
                if fnmatch.fnmatch(dir, string):
                    yield os.path.join(name, *os.path.join(root, dir)[len(sharedir):].split("/"))
            for file in files:
                if fnmatch.fnmatch(file, string): 
                    yield os.path.join(name, *os.path.join(root, ile)[len(sharedir):].split("/"))

您不需要保持树结构 – 事实上,您的代码忙于将目录树的自然树结构拆分为线性序列,那么为什么您希望下次从树重新启动？

看起来你需要的只是一个有序的序列：

i   X    result of os.path.join for X

其中X,一个字符串,命名文件或目录(你只是对它们进行处理),i是逐步递增的整数(以保持顺序),结果列,也是一个字符串,是os的结果. path.join(name,* os.path.join(root,& c.

当然,这很容易放在sql表中！

要在第一次创建表时,只需从populate函数中删除保护,如果fnmatch.fnmatch(和字符串参数),在os.path.join结果之前生成dir或文件,并使用cursor.executemany保存枚举调用(或者,使用自增量列,您的选择).要使用该表,populate基本上变为：

select result from thetable where X LIKE '%foo%' order by i

字符串是foo.

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 [email protected] 举报，一经查实，本站将立刻删除。

相关推荐

SSM+校园网上订餐系统毕业设计-附源码211510

校园网上订餐系统系统主要功能模块包括公告内容（公告栏、轮播图）用户管理（管理员、普通用户）、内容模块（资讯分类、资讯列表）、模块管理（菜品分类、菜单、订单表），采取面对对象的开发模式进行软件的开发和硬...

作者：weixin_61498557 时间：2022-12-19

【SpringBoot项目】SpringBoot项目-瑞吉外卖【day01】

从今天开始，正式进入项目阶段。本次的项目是跟着黑马的瑞吉外卖项目走的，有借鉴和使用，也有自己的观点和实现。由于本课程用到了很多前端知识（了解），所以关于前端分析的时候，我应该会选择跳过或者简略一看；大...

作者：己不由心王道长时间：2022-12-06

软件测试的行业现状，我们的未来在哪里？

在可预见的将来，IT不会萎缩，只会越发展越庞大，最终会渗透到人类社会的每一个角落。在这个过程中会不断地产生新的领域和新的机会，我们则需要在这个风口上抓住机会。从技术层面来说，吃透测试理论和方法，掌握最少...

作者：静姐说测试时间：2022-12-06

vulntarget-b靶场详细通关记录

vulntarget-b靶场最详细通关记录。

作者：tpaer 时间：2022-12-06

Navicat远程连接MongoDB最全解决方法教程、报错

MongoDB是一个开源、高性能、支持海量数据存储的。

作者：不凉帅时间：2022-12-06

【NoSQL数据库技术与应用】【课本代码】【课后题答案】【持续更新】

【NoSQL数据库技术与应用】课本代码、课后答案（持续更新）

作者：爱笑的冷面鬼时间：2022-12-06

MongoDB 的安装详细过程

MongoDB 的安装详细过程

作者：xoste 时间：2022-11-29

什么是NoSQL？随着这次训练就来学习一下

学习一下什么是Nosql

作者：秦羽时间：2022-11-23

Redisredis 简介redis 采用的是单线程的 KV 模型，由 C 语言编写，1. Redis 中的事务？2. Redis 中的数据结构3. Redis 中如何保证缓存和数据库双写时的数据一致性？4. 如何使用 Redis 做异步队列和延时队列？5. Redi...

作者：王叮咚时间：2022-11-22

10题经典Redis面试题

Redis必背面试题

作者：努力学习的小白灬时间：2022-11-22