手机版
热门标签
站点地图
我要投稿
广告合作
联系我们
搜 索
广告位招租
广告位招租
切换导航
首页
编程教程
编程导航
编程百科
编程问答
编程博文
编程实例
硬件设备
网络运营
软件教程
移动数码
办公软件
操作系统
人工智能
栏目导航
▸ 编程语言
▸ 前端开发
▸ 移动开发
▸ 开发工具
▸ 程序设计
▸ 行业应用
▸ CMS系统
▸ 服务器
▸ 数据库
公众号推荐
微信公众号搜
"智元新知"
关注
微信扫一扫可直接关注哦!
子栏目导航
大数据
图像处理
chatgpt
文心一言
DevOps
Kafka
Spark
Dubbo
NLP
力扣
编程之家
大数据
[源码分析] 从源码入手看 Flink Watermark 之传播过程
本文将通过源码分析,带领大家熟悉Flink Watermark 之传播过程,顺便也可以对Flink整体逻辑有一个大致把握。
作者:编程之家 时间:2020-12-17
从"UDF不应有状态" 切入来剖析Flink SQL代码生成
ɿlink SQL UDF不应有状态' 这个技术细节可能有些朋友已经知道了。但是为什么不应该有状态呢?这个恐怕大家就不甚清楚了。本文就带你一起从这个问题点入手,看看Flink SQL究竟是怎么处理U
作者:编程之家 时间:2020-12-17
[白话解析] Flink的Watermark机制
对于Flink来说,Watermark是个很难绕过去的概念。本文将从整体的思路上来说,运用感性直觉的思考来帮大家梳理Watermark概念。
作者:编程之家 时间:2020-12-17
Alink漫谈(一) : 从KMeans算法实现不同看Alink设计思想
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文将带领大家从多重角度出发来分析推测Alink的设计思路。
作者:编程之家 时间:2020-12-17
[源码分析] 从实例和源码入手看 Flink 之广播 Broadcast
本文将通过源码分析和实例讲解,带领大家熟悉Flink的广播变量机制。
作者:编程之家 时间:2020-12-17
[记录点滴] 小心 Hadoop Speculative 调度策略
本文从一个bug入手,为大家展示Hadoop Speculative机制,以及编写mapreduce程序的注意点。
作者:编程之家 时间:2020-12-17
[源码解析] 从TimeoutException看Flink的心跳机制
本文从一个调试时候常见的异常 'TimeoutException: Heartbeat of TaskManager timed out'切入,为大家剖析Flink的心跳机制。文中代码基于Flink
作者:编程之家 时间:2020-12-17
[源码分析] 从FlatMap用法到Flink的内部实现
本文将从FlatMap概念和如何使用开始入手,深入到Flink是如何实现FlatMap。希望能让大家对这个概念有更深入的理解。
作者:编程之家 时间:2020-12-17
Alink漫谈(六) : TF-IDF算法的实现
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。TF-IDF(term frequency–inverse doc
作者:编程之家 时间:2020-12-17
Alink漫谈(五) : 迭代计算和Superstep
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。迭代算法在很多数据分析领域会用到,比如机器学习或者图计算。本文将通
作者:编程之家 时间:2020-12-17
[源码解析] Flink的groupBy和reduce究竟做了什么
Groupby和reduce是大数据领域常见的算子,但是很多同学应该对其背后机制不甚了解。本文将从源码入手,为大家解析Flink中Groupby和reduce的原理,看看他们在背后做了什么。
作者:编程之家 时间:2020-12-17
Alink漫谈(四) : 模型的来龙去脉
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文将从模型角度入手带领大家来再次深入Alink。
作者:编程之家 时间:2020-12-17
[源码分析]从"UDF不应有状态" 切入来剖析Flink SQL代码生成 (修订版)
ɿlink SQL UDF不应有状态' 这个技术细节可能有些朋友已经知道了。但是为什么不应该有状态呢?这个恐怕大家就不甚清楚了。本文就带你一起从这个问题点入手,看看Flink SQL究竟是怎么处理U
作者:编程之家 时间:2020-12-17
[梁山好汉说IT] 用实例来深入理解容器概念
如何对没有软件开发经验的人解释容器? 集装箱真的能够完美解释容器嘛? 除了集装箱还有其他常见实体能够解释容器嘛? 我找到了一个能够 和集装箱搭配起来 解释容器的例子:军队,或者更准确的是说北宋军队制度
作者:编程之家 时间:2020-12-17
[梁山好汉说IT] 梁山好汉和秒杀系统
今天看了一篇好文章,里面一些思路颇值得借鉴。先摘录总结精华。然后看看梁山好汉如何处理秒杀系统(系统隔离/系统搭建/风控过滤/削峰/信号广播......)。
作者:编程之家 时间:2020-12-17
[梁山好汉说IT] 如何理解脑裂问题
本文通过梁山好汉的例子来加深理解脑裂问题
作者:编程之家 时间:2020-12-17
Databricks说的Lakehouse是什么?
在过去的几年里,Lakehouse作为一种新的数据管理范式,已独立出现在Databricks的许多用户和应用案例中。在这篇文章中,我们将阐述这种新范式以及它相对于之前方案的优势
作者:编程之家 时间:2020-12-11
大数据领域常用技术栈
提起大数据,不得不提由IBM提出的关于大数据的5V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性),而对于大数据领域的
作者:编程之家 时间:2020-12-11
九种常见的数据分析模型
基于大数据分析促进企业的精细化运营、数据驱动,数据分析模型
作者:编程之家 时间:2020-12-11
大数据的技术生态概述转载
"如何用形象的比喻描述大数据的技术生态?Hadoop、Hive、Spark 之间是什么关系?" 大数据本身是个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过
作者:编程之家 时间:2020-11-25
Presto 常用配置及操作
一、介绍 Presto是一个开源的分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB字节。 Presto的设计和编写完全是为了解决像Facebook这样规模的商业数据仓库的交互式分析和处
作者:编程之家 时间:2020-11-25
Hive 导入 parquet 格式数据
Hive 导入 parquet 数据步骤如下: 1. 查看 parquet 文件的格式 2. 构造建表语句 3. 倒入数据 一、查看 parquet 内容和结构 下载地址 "社区工具&quo
作者:编程之家 时间:2020-11-25
分布式基础通信协议:paxos、totem 和 gossip转载
背景: 在分布式中,最难解决的一个问题就是多个节点间数据同步问题。为了解决这样的问题,涌现出了各种奇思妙想。只有在解决了如何进行信息同步的基础之上才衍生出形形色色的应用。这里开始介绍几种分布式通信协议
作者:编程之家 时间:2020-11-25
pyhive 连接 Hive 时错误
一、User: xx is not allowed to impersonate xxx' 解决办法:修改 文件,加入下面的内容后重启 hadoop 。 Tips: 注意是 不是 二、ACCE
作者:编程之家 时间:2020-11-25
天勤OJ 1098 大数处理之《N的阶乘》
题目地址:http://www.acmclub.com/problem.php?id=1098 #include<string.h> #include<stdio.h> #define MAXS 3002 typedef struct E{ int num[MAXS]; int lenth; }E; E ans[1001]; E mul(E a,int k) { int i; for(
作者:编程之家 时间:2020-10-17
BI笔记之---合理处理SSAS数据库的几点建议
今天又有朋友遇到SSAS数据库处理速度慢的情况,主要是由于数据聚合量确实很大,每次处理都要超过三十分钟,有没有什么方法能让处理的时间少一些呢? 从事BI工作有七个年头了,这样类似的问题绝对可以排在职业圈内TOP 10的FAQ当中。这样的问题往往都略有复杂,在此根据遇到过的一些场景,罗列一些自己的经验。 由于篇幅限制,这里只介绍遇到问题时的解决思路,详细的操作我会链接到我的其它随笔供大家实际操作的时
作者:编程之家 时间:2020-10-17
NYOJ - 大数阶乘
大数阶乘 时间限制: 3000 ms | 内存限制: 65535 KB 难度: 3 描述 我们都知道如何计算一个数的阶乘,可是,如果这个数很大呢,我们该如何去计算它并输出它? 输入 输入一个整数m(0<m<=5000) 输出 输出m的阶乘,并在输出结束之后输入一个换行符 样例输入 50 样例输出 3041409320171337804361260816606476884437
作者:编程之家 时间:2020-10-17
找出数组中下一个大数
给出一整数数组,找出比当前元素大的下一个数。 Array on integer is given find out next bigger number Ex {2,5,3,4,6,1} Out: 2->5 5->6 3->4 4->6 6->-1 //not possible 1-> -1 //not possible 算法时间和空间复杂度都为O(n) 用栈来维护数组的下标。 O(n) time
作者:编程之家 时间:2020-10-17
大数相乘
#include "stdafx.h" #include <stdio.h> #include <string.h> #include <conio.h> #define LEN 1000 void mult(char [],char [],char []); main(){ char op1[LEN],op2[LEN],op3[LEN*2-1]; scanf(
作者:编程之家 时间:2020-10-17
BI笔记之--- SSAS部署的几种方式
SSAS库的部署有很多种方式,根据环境的不同可以选择不同的方法,本文列举几种最常见的部署方式,以及阐述他们的应用环境。 环境约定:SQL Server 2008 示例库:Adventure Works DW 方式一:Visual Studio直接Deploy 这个方法是最直接简单的方法,大多数我们都是通过这种方法部署到本地,如果需要部署到其它机器上参考下图: 右键点击SSAS项目然后选择"
作者:编程之家 时间:2020-10-17
上一页
4
5
6
7
8
9
10
11
下一页
小编推荐
热门标签
更多
python
JavaScript
java
HTML
reactjs
C#
Android
CSS
Node.js
sql
r
python-3.x
MysqL
jQuery
c++
pandas
Flutter
angular
IOS
django
linux
swift
typescript
路由器
JSON
路由器设置
无线路由器
h3c
华三
华三路由器设置
华三路由器
电脑软件教程
arrays
docker
软件图文教程
C
vue.js
laravel
spring-boot
react-native