本文主要介绍hadoop3.0 HA高可用分布式集群搭建过程,该文章是博主多次实践后而写,亲测有效!!! 需要的朋友可以按照这个步骤来搭建自己的环境~~ 一、安装整体架构
今天要实现的功能是:通过langchian4j的函数调用,实现上传本地文件到HDFS文件系统,同时执行Mapreduce程序,完成WordCount功能,最后读取单词统计结果。 扩展:这里还可以调用咱们的sql的Tool,可以将结果存入数据库等操作~~ 一、搭建大数据环境 搭建过程就不多说了,步骤比
说明:本章节主要介绍使用docker部署superset3.1.1,以及简单的使用。 superset是什么? Superset is fast, lightweight, intuitive, and loaded with options that make it easy for users
1、基本介绍 DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、SQL Server、Oracle、PostgreSQL、HDFS、Hive、HBase、OTS、ODPS 等各种异构数据源之间高效的数据同步功能。 1.1、设计理念 为了解决异构数据源同步问题,Da
一、下载 1.1 下载地址:https://raw.githubusercontent.com/smartloli/kafka-eagle-bin/master/efak-web-3.0.2-bin.tar.gz 二、安装 因为eagle是用java编写的,所以需要提前安装好java环境 2
1、创建topic 使用shell新开一个node001的窗口 命令建议手敲(不仅仅是为了练习代码,重要的是:我复制命令粘贴上去有时候要报错,手敲却没问题,不知道为啥) 终端输入: kafka-topics.sh --bootstrap-server node3:9092 --create --to