기존 Hadoop 클러스터에 대해 실행되도록 Cloud Data Fusion 파이프 라인을 구성하는 방법

스리

Cloud Data Fusion은 모든 파이프 라인 실행에 대해 새로운 Dataproc 클러스터를 만듭니다. 연중 무휴 24 시간 실행되는 Dataproc 클러스터 설정이 이미 있으며 해당 클러스터를 사용하여 파이프 라인을 실행하고 싶습니다.

스리

시스템 관리자-> 구성-> 시스템 컴퓨팅 프로필-> 새 컴퓨팅 프로필 만들기에서 원격 Hadoop 프로비저닝 도구를 사용하여 새 컴퓨팅 프로필을 설정하면됩니다. 이 기능은 Cloud Data Fusion의 Enterprise 버전 ( "실행 환경 선택" ) 에서만 사용할 수 있습니다 .

자세한 단계는 다음과 같습니다.

  1. Dataproc 클러스터에서 SSH 설정

    ㅏ. Google Cloud Platform의 Dataproc 콘솔로 이동합니다. Dataproc 클러스터 이름을 클릭하여 '클러스터 세부 정보'로 이동합니다.

    비. 'VM 인스턴스'에서 'SSH'버튼을 클릭하여 Dataproc VM에 연결합니다.Dataproc VM SSH

    씨. 여기 의 단계에 따라 새 SSH 키를 만들고, 공개 키 파일의 형식을 지정하여 만료 시간을 적용하고, 프로젝트 또는 인스턴스 수준에서 새로 생성 된 SSH 공개 키를 추가하세요.

    디. SSH가 성공적으로 설정되면 Compute Engine 콘솔의 메타 데이터 섹션에서 방금 추가 한 SSH 키와 Dataproc VM의 authorized_keys 파일을 볼 수 있습니다.Dataproc SSH 키

  2. Data Fusion 인스턴스를위한 맞춤형 시스템 컴퓨팅 프로필 생성

    ㅏ. '인스턴스보기'를 클릭하여 Data Fusion 인스턴스 콘솔로 이동합니다.여기에 이미지 설명 입력

    비. 오른쪽 상단의 "시스템 관리자"를 클릭합니다.여기에 이미지 설명 입력

    씨. "구성"탭에서 "시스템 컴퓨팅 프로필"을 확장합니다. "Create New Profile"을 클릭하고 다음 페이지에서 "Remote Hadoop Provisioner"를 선택합니다.커미션 여기에 이미지 설명 입력

    디. 프로필에 대한 일반 정보를 입력합니다.

    이자형. Compute Engine의 'VM 인스턴스 세부 정보'페이지에서 SSH 호스트 IP 정보를 찾을 수 있습니다.여기에 이미지 설명 입력

    에프. 1 단계에서 생성 한 SSH 개인 키를 복사하여 "SSH 개인 키"필드에 붙여 넣습니다.

    지. "만들기"를 클릭하여 프로필을 만듭니다.프로필

  3. 사용자 지정 프로필을 사용하도록 Data Fusion 파이프 라인 구성

    ㅏ. 원격 Hadoop에 대해 실행할 파이프 라인을 클릭하십시오.

    비. 구성-> 컴퓨팅 구성을 클릭하고 원격 하둡 프로비저닝 도구 구성을 선택합니다.파이프 라인 원격 Hadoop 컴퓨팅 프로필

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

이미 게시 된 Cloud Data Fusion 파이프 라인을 편집하는 방법

파이프 라인의 출력을 얻고 Cloud Firestore에 대한 읽기 및 쓰기를 수행하는 방법

http 프록시에 대한 netty 파이프 라인을 구성하는 방법

Google Cloud Data Fusion에서 SQL Server를 입력 드라이버로 사용하여 파이프라인을 만드는 방법은 무엇입니까?

Lets-encrypt 인증서가 작동하는 여러 로컬 시스템에 대해 기존 nginx 구성을 역방향 프록시로 변경하는 방법

여러 분기에 대해 여러 파이프 라인 젠킨스를 실행하는 방법

BitBucket 파이프 라인에서 FastAPI 테스트를 실행하도록 postgresql을 구성하는 방법

작업당 별도의 네임스페이스에서 작업을 실행하도록 Spring Cloud Data Flow를 구성하는 방법은 무엇입니까?

Data Fusion 인스턴스 삭제 후 파이프 라인을 저장하는 방법

파이프 라인이 무기한 실행되도록하는 손상된 젠킨스 파일로부터 보호하는 방법은 무엇입니까?

sklearn 파이프 라인에서 범주 기능을 대치하기 위해 KNN을 구현하는 방법

매주 화요일에 실행되도록 ADF V1 파이프라인을 설정하는 방법

k8s 클러스터 내부에서 아틀라스에 연결하기 위해 mongo에 대한 DNS 해상도를 구성하는 방법

k8s 클러스터 내부에서 아틀라스에 연결하기 위해 mongo에 대한 DNS 해상도를 구성하는 방법

다른 구성 파일로 파이프 라인을 여러 번 실행하는 방법-.snakemake 디렉터리에 대한 잠금 문제

3 개의 다른 호스트에서 실행되도록 의도 된 기존 Docker Compose 파일에 대해 Docker Swarm을 설정하는 방법은 무엇입니까?

라이프 사이클 구성에 포함되지 않는 플러그인 실행을 해결하는 방법 : org.codehaus.mojo : exec-maven- plugin : 1.5.0 : exec?

생물 정보학 파이프 라인의 시퀀싱 단위를 설명하기 위해 Snakemake Tabular 구성에서 목록을 사용하는 방법

기존 온-프레미스 클러스터에 대해 Azure Service Fabric 역방향 프록시를 구성하고 활성화하는 방법은 무엇입니까?

Google Cloud Run에서 실행되도록 Dockerfile을 올바르게 구성하는 방법은 무엇입니까?

kubernetes에서 이미 실행중인 클러스터를 구성하는 방법

Autofac이 기존 클래스에 클래스/인터페이스의 여러 인스턴스를 동시에 주입하는 데 도움이 되는 방법

백그라운드 작업이있는 서비스, 작업이 클러스터 당 한 번만 주기적으로 실행되도록하는 방법

Google Cloud Platform에서 특정 데이터 파이프 라인을 구성하는 방법은 무엇입니까?

동일한 파이프라인이 동시에 두 번 실행되지 않도록 하는 방법

빌드 성공 및 빌드 실패에 대한 다른 정보 세트를 보내기 위해 jenkins 파이프라인에서 이메일 구성을 작성하는 방법은 무엇입니까?

프로그램을 인증하기 위해 클라이언트 IP를 전달하도록 squid를 구성하는 방법은 무엇입니까?

Firebase 실시간 데이터베이스에서 단일 쿼리에 대해 오프라인 기능을 활성화하는 방법은 무엇입니까?

Azure DevOps 파이프라인에서 ARM-TTK 테스트를 실행하기 위해 *.json 파일에 대해 두 개의 경로를 지정하는 방법

TOP 리스트

  1. 1

    C # 16 진수 값 0x12는 잘못된 문자입니다.

  2. 2

    Matlab의 반복 Sortino 비율

  3. 3

    Python의 csv 파일에서 첫 번째 열 삭제

  4. 4

    개체 참조가 개체의 인스턴스로 설정되지 않았습니까? (예외 오류 ~ ASP.NET MVC)

  5. 5

    atob은 인코딩 된 base64 문자열을 디코딩하지 않습니다.

  6. 6

    EventEmitter <string>의 컨텍스트 'this'가 Observable <string> 유형의 'this'메서드에 할당되지 않았습니다.

  7. 7

    병합 셀을 사용하여 워크 시트의 데이터 필터링

  8. 8

    PhpStorm 중단 점에서 변수 값을 볼 수 없습니다.

  9. 9

    jQuery에서 이벤트 핸들러를 제거하는 가장 좋은 방법은 무엇입니까?

  10. 10

    `@ Transactional`이 있음에도 불구하고 이러한 데이터베이스 수정 사항이 롤백되지 않는 이유는 무엇입니까?

  11. 11

    ssh를 사용하여 원격에서 로컬로 파일 복사

  12. 12

    종속 사용자 정의 Lightning 선택 목록 Level2 및 Level3을 설정한 다음 Lightning 구성 요소에서 Level2를 재설정하지만 Level2 캐시 데이터가 저장됨

  13. 13

    2 개의 이미지를 단일 평면 이미지로 결합

  14. 14

    팝업처럼 위젯을 표시하는 방법

  15. 15

    [해결] 쿠키 설정 SameSite = Chrome / JSP, JAVASCRIPT에서 작동하지 않습니다.

  16. 16

    버튼 클릭을 기반으로 특정 CSS 클래스를 추가하는 방법은 무엇입니까?

  17. 17

    React 구성 요소가 자동으로 초기 상태로 다시 렌더링됩니다.

  18. 18

    연결된 서버 쿼리는 작동하지만 동일한 OPENQUERY는 "sys.servers에서 서버 'SERVER'를 찾을 수 없습니다.

  19. 19

    파일 2의 파일 1에서 동일한 줄을 조건으로 바꿉니다.

  20. 20

    아이디어 Intellij : 종속성 org.json : json : 20180813을 찾을 수 없음, maven에서 org.json 라이브러리를 가져올 수 없음

  21. 21

    상황에 맞는 메뉴 색상

뜨겁다태그

보관