手机版
热门标签
站点地图
我要投稿
广告合作
联系我们
搜 索
广告位招租
广告位招租
切换导航
首页
编程教程
编程导航
编程百科
编程问答
编程博文
编程实例
硬件设备
网络运营
软件教程
移动数码
办公软件
操作系统
人工智能
栏目导航
▸ 编程语言
▸ 前端开发
▸ 移动开发
▸ 开发工具
▸ 程序设计
▸ 行业应用
▸ CMS系统
▸ 服务器
▸ 数据库
公众号推荐
微信公众号搜
"智元新知"
关注
微信扫一扫可直接关注哦!
子栏目导航
大数据
图像处理
chatgpt
文心一言
DevOps
Kafka
Spark
Dubbo
NLP
力扣
编程之家
大数据
大数据调度平台Airflow七:Airflow分布式集群搭建原因及其他扩展
在稳定性要求较高的场景中,例如:金融交易系统,airflow一般采用集群、高可用方式搭建部署,airflow对应的进程分布在多个节点上运行,形成Airflow集...
作者:Lanson 时间:2022-09-28
大数据扫黄,是怎样发现你的?
来源:163.com/dy/article/HF5UJGGH05319928.html 尾 扩展阅读 在诸多审查工具中,“AI 鉴黄”是最新也最高效...
作者:程序猿DD 时间:2022-09-25
转行大数据1个月,和想的不太一样
转行大数据1个月,和想的不太一样。。。
作者:编程之家 时间:2022-09-20
为什么那么多人说大数据只是写SQL?
我们真不是SqlBoy。
作者:大数据指北 时间:2022-08-31
大数据ClickHouse十二:MergeTree系列表引擎之CollapsingMergeTree
CollapsingMergeTree就是一种通过以增代删的思路,的表引擎。它通过定义一个sign标记位字段,记录数据行的状态。如果sign标记为1,则表示这是一行有效的数据;如果sign标记为-1,则表示这行数据需要被删除。当CollapsingMergeTree分区合并时,同一数据分区内,sign标记为1和-1的一组数据会被抵消删除。每次需要新增数据时,写入一行sign标记为1的数据;需要删除数据时,则写入一行sign标记为-1的数据。此外,只有相同分区内的数据才有可能被折叠。......
作者:Lansonli 时间:2022-08-31
大数据的薪资怎么样?想学大数据了?
猎聘大数据研究院发布了《2022未来人才就业趋势报告》从排名来看,2022年1-4月各行业中高端人才平均年薪来看,人工智能行业中高端人才平均年薪最高,为31.04万元;金融行业中高端人才以27.69万元的平均年薪位居第二;通信、大数据行业中高端人才平均年薪分别为27.51万元、25.23万元,位列第三、第四;IT/互联网行业中高端人才平均年薪23.02万元,位列第七。图表来源:《2022未来人才就业趋势报告》如果你觉得很高,被平均了这样?
作者:我想去吃ya 时间:2022-08-31
一文搞懂什么是Hadoop?Hadoop的前世今生,Hadoop的优点有哪些?Hadoop面试考查重点,大数据技术生态体系
目录1.1 Hadoop 是什么 1.2 Hadoop 发展历史1.3 Hadoop 三大发行版本 1.4 Hadoop优势(4高) 1.5 Hadoop 组成(面试重点) 1.5.1 HDFS 架构概述 1.5.2 YARN 架构概述 1.5.3 MapReduce 架构概述 1.5.4 HDFS、YARN、MapReduce 三者关系 1.6 大数据技术生态体系 1.7 推荐系统框架图 假如说购买一个东西,打开京东首页,购买一个东西,这个购买行为会被记录下来,通过Nginx负载均衡打入到日
作者:Echo bigdata 时间:2022-08-26
大数据面试常见问题四——ETL部分
目录1、什么是映射2、什么是etl3、kettle抽数一般遇到什么问题,你们是怎么解决的?4、如果抽取的数据有重复,怎么解决5、etl脚本开发以后,怎么运维6、一张特别大的表,几千万,几亿 的表,怎么通过etl工具同步7、数据同步以后,源系统的表结构发生了改变,比如源系统的表增加了字段,你的kettle脚本是否会报错?8、有一张表下午5点才出数据,依赖的表早上十点就已经跑完了,是什么原因导致表这么慢出数据(从数仓同步数据,本来早上9点就要出结果,结果一直到下午4点才出结果)9、有一个job前一天执行成功了,
作者:大数据求学路 时间:2022-08-26
大数据工程师的日常工作内容是干嘛?
我们真的是Sqlboy吗?
作者:大数据指北 时间:2022-08-26
大数据批量处理神器 - 自定义周期批量消费队列的实现
大数据批量处理神奇-自定义周期批量消费队列的实现周期批量消费队列(BlockingQueue)的实现LinkedBlockingQueue与ArrayBlockingQueue的比较
作者:Pushkin. 时间:2022-08-26
大数据ClickHouse二十:ClickHouse 可视化工具操作
tabix支持通过浏览器直接连接 ClickHouse,不需要安装其他软件,就可以访问ClickHouse。有两种使用方式,一种是直接浏览器访问配置。另一种是使用ClickHouse内嵌方式。
作者:Lansonli 时间:2022-08-26
深度学习 机器学习 数据集资源汇总
目前个人认为较好的数据集网站主要有:数据集网站1.AI Studio数据集: 开放数据集-百度AI Studio - 人工智能学习与实训社区2.天池数据集:数据集-阿里系唯一对外开放数据分享平台3.Papers With Code数据集:Machine Learning Datasets | Papers With Code4.Kaggle 数据集:Find Open Datasets and Machine Learning Projects | Kaggle5.Graviti O
作者:[山青花欲燃] 时间:2022-12-21
【机器学习】python实现吴恩达机器学习作业合集含数据集
目录1.0 实现线性回归预测2.0 线性可分logistic逻辑回归2.1 线性不可分logistic逻辑回归3.0 logistic逻辑回归手写多分类问题3.1 神经网络正向传播4.0 神经网络反向传播(BP算法)5.0 方差与偏差6.0 SVM支持向量机7.0 kmeans聚类7.1 PCA主成分分析...
作者:—Xi— 时间:2022-12-21
大数据技术之Hadoop入门概述、运行环境搭建、运行模式
文章目录1 Hadoop 概述1.1 Hadoop 是什么1.2 Hadoop 优势1.3 Hadoop 组成1.3.1 HDFS 架构概述2 组管理和权限管理2.1 组管理2.2 权限管理3 任务调度1 Hadoop 概述1.1 Hadoop 是什么(1)Hadoop是一个由Apache基金会所开发的分布式系统基础架构(2)主要解决海量数据的存储和海量数据的分析计算问题(3)广义上来说,Hadoop通常是指一个更广泛的概念——Hadoop生态圈1.2 Hadoop 优势(1)高可靠性:H.
作者:@从一到无穷大 时间:2022-12-21
Yolov7:最新最快的实时检测框架,最详细分析解释附源代码
关注并星标从此不迷路计算机视觉研究院公众号ID|ComputerVisionGzq学习群|扫码在主页获取加入方式论文地址:https://arxiv.org/pdf/2207.02696.pdf代码地址:https://github.com/WongKinYiu/yolov7计算机视觉研究院专栏作者:Edison_GYOLOv7相同体量下比YOLOv5精度更高,速度快12...
作者:计算机视觉研究院 时间:2022-12-21
大数据ClickHouse八:MergeTree系列表引擎之MergeTree重点掌握
在所有的表引擎中,最为核心的当属MergeTree系列表引擎,这些表引擎拥有最为强大的性能和最广泛的使用场合。对于非MergeTree系列的其他引擎而言,主要用于特殊用途,场景相对有限。而MergeTree系列表引擎是官方主推的存储引擎,有主键索引、数据分区、数据副本、数据采样、删除和修改等功能,支持几乎所有ClickHouse核心功能。......
作者:Lansonli 时间:2022-12-21
学完了Hadoop,我总结了这些重点
大数据生态圈中最基础、最重要的组件。大数据小菜鸟迈出的第一步!
作者:苍夜月明 时间:2022-08-04
大数据开发写sql写烦了,要不要转?
如果说大数据是每天写sql还不太精准(精准的是用各种方式写SQL)当你不创造东西时,你只会根据自己的感觉而不是能力去看待问题。会不会转别的,看个人兴趣,大数据方向还有那么多。瞅瞅方向:如数据分析师、大数据开发工程师、大数据分析师、数据开发工程师、大数据架构师、大数据运维工程师、ELT工程师、数据仓库工程师、大数据BI工程师等。丰富自己的能力,到处都机会。现如今,正式为了应对大数据的这几个特点,开源的大数据框架越来越多,越来越强,先列举一些常见的:文件存储:Hadoop HDFS、Tachyon、
作者:测试小扎 时间:2022-08-02
湖仓一体电商项目三:3万字带你从头开始搭建12个大数据项目基础组件
在node1、node2、node3节点上/etc/clickhouse-server/config.d路径下下配置metrika.xml文件,默认clickhouse会在/etc路径下查找metrika.xml文件,但是必须要求metrika.xml上级目录拥有者权限为clickhouse,所以这里我们将metrika.xml创建在/etc/clickhouse-server/config.d路径下,config.d目录的拥有者权限为clickhouse。每个分片的副本,默认每个分片配置了一个副本。...
作者:Lansonli 时间:2022-08-02
Scala 基础 三:运算符和流程控制
Scala中的运算符和Java中的运算符基本相同。算术运算 ,和在一元运算表中示正号和负号,在二元运算中表示加和减。表示整除,只保留整数部分舍弃掉小数部分除此之外,也表示两个字符串相加关系运算逻辑运算赋值运算位运算在 Scala 中其实是没有运算符的,所有运算符都是方法的调用。举个栗子:二、流程控制Scala中的流程控制与其他的编程语言一样,也包含分支语句、循环语句等。基本语法:举个栗子:特殊之处:举个栗子:forScala中的循环被称为的推导式范围遍历:表示循环变量 相当于将遍历值赋给
作者:百思不得小赵 时间:2022-07-28
Hadoop生态之Hive一
数仓工具之Hive,深度解析Hive结构以及原理
作者:红糖番薯 时间:2022-07-28
华为云从入门到实战 | 云服务概述与华为云搭建Web应用
云计算在快速发展过程中逐渐形成了不同的服务模式(Service Model)。根据云计算最终服务的交付形态主要分为3种类型,软件即服务、平台即服务与基础架构即服务。从根源上来说,云计算的服务模式来源于面向服务的架构SOA(Service-Oriented Architecture)。所谓SOA,就是一种架构设计模式,其核心是一切以服务为中心,不同的应用之间通信协议都以某种服务的方式定义和完成。在云中部署应用和服务的微服务架构其本质也是由SOA演变而来。...
作者:TiAmo zhang 时间:2022-07-28
《Java SE》网络编程基础知识归纳
目录一、网络基本介绍1、什么是网络通信?2、网络3、IP地址4、域名5、网络通信协议6、Socket二、TCP网络通信编程 1、应用实例1(字节流)2、应用实例2(字节流)3、应用实例3(字符流)4、netstat 指令三、UDP网络通信编程 1、基本介绍2、基本流程3、应用实例...
作者:小黎的培培笔录 时间:2022-07-28
Maven项目构建工具
** Maven项目对象模型(POM),可以通过一小段描述信息来管理项目的构建,报告和文档的项目管理工具软件。**Maven 除了以程序构建能力为特色之外,还提供高级项目管理工具。由于 Maven 的缺省构建规则有较高的可重用性,所以常常用两三行 Maven 构建脚本就可以构建简单的项目。由于 Maven 的面向项目的方法,许多 Apache Jakarta 项目发文时使用 Maven,而且公司项目采用 Maven 的比例在持续增长。......
作者:轻狂客_零度 时间:2022-07-28
【云原生】3.1 Kubernetes平台安装KubeSpher
选择4核8G(master)、8核16G(node1)、8核16G(node2) 三台机器,按量付费进行实验。假设你的机器没有安装Docker、没有安装Kubernetes、没有集群,那么可以看看之前写的文章,那里面有讲解,这里就直接从前置环境开始讲解吧。.........
作者:程序猿追 时间:2022-07-28
英雄联盟胜负预测--简易肯德基上校
大道五十,天衍四九,%s遁其一。
作者:老师我作业忘带了 时间:2022-07-28
有哪些高质量的自学网站?
分享32个鲜为人知并且完全免费的高质量自学网站,每个都是堪称神器,让你相见恨晚。
作者:空弦的编程小屋 时间:2022-07-23
效率低?响应慢?报表工具痛点及其解决方案
许多朋友曾和我诉苦:使用报表工具不就是为了解决手工开发报表效率低、困难多等这些让人头痛的难题的吗?怎么用了大牌工具还会头痛,是功能不行解决不了这些问题?**不,并不是,因为用错了报表工具,或者没有用对姿势。...
作者:字母哥哥 时间:2022-07-23
Scala 高阶七:集合内容汇总上篇
在JavaList集合、Set集合、Map集合。其中List集合、Set集合继承自Collection。它们都是接口。Scala的集合有三大类序列Seq、集Set、映射Map,所有的集合都扩展自Iterable特质。、可变集合s不可变集合,就是指该集合对象不可修改,每次修改就会返回一个新对象,而不会对原对象进行修改。类似于java中的String对象。可变集合,就是这个集合可以直接对原对象进行修改,而不会返回新的对象。类似于java中StringBuilder对象和就是j。...
作者:百思不得小赵 时间:2022-07-21
【云原生丨Docker系列4】用Dockerfile脚本定制镜像最优解
镜像的定制实际上就是定制每⼀层所添加的配置、⽂件等信息。但是命令毕竟只是命令,一般用 docker commit 每次定制都得去重复执⾏这个命令,⽽且还不够直观,如果我们可以把每⼀层修改、安装、构建、操作的命令都写⼊⼀个脚本,⽤这个脚本来构建、定制镜像,那么这些问题就迎刃而解了,而这个脚本就是我们今天要说的 Dockerfile 。......
作者:陈橘又青 时间:2022-07-21
上一页
1
2
3
4
5
6
7
8
下一页
小编推荐
热门标签
更多
python
JavaScript
java
HTML
reactjs
C#
Android
CSS
Node.js
sql
r
python-3.x
MysqL
jQuery
c++
pandas
Flutter
angular
IOS
django
linux
swift
typescript
路由器
JSON
路由器设置
无线路由器
h3c
华三
华三路由器设置
华三路由器
电脑软件教程
arrays
docker
软件图文教程
C
vue.js
laravel
spring-boot
react-native