Como instalar pacotes python em um cluster do Google Dataproc

Pablo Brenner:

É possível instalar pacotes python em um cluster do Google Dataproc após a criação e execução do cluster?

Tentei usar " pip install xxxxxxx" na linha de comando principal, mas parece não funcionar.

A documentação do Google Dataproc não menciona essa situação.

tix:

Isso geralmente não é possível após a criação do cluster. Eu recomendo usar uma ação de inicialização para fazer isso.

Como você notou, piptambém não está disponível por padrão. Então você vai querer correr easy_install pipseguido pelo pip installcomando.

Por fim, se sua intenção é usar esse cluster em qualquer automação e / ou você desejar hermeticidade, recomendo criar um wheelque você armazene no GCS e faça o download na ação init. Você instalaria sua roda. As rodas adicionaram o benefício de serem mais rápidas do que instalar muitos pacotes diretamente do pip.

Atualização de 2019

Consulte este tutorial sobre como configurar o ambiente Python no Dataproc: https://cloud.google.com/dataproc/docs/tutorials/python-configuration

Este artigo é coletado da Internet.

Se houver alguma infração, entre em [email protected] Delete.

editar em
0

deixe-me dizer algumas palavras

0comentários
loginDepois de participar da revisão

Artigos relacionados

Como instalar e executar pip no cluster do Google Dataproc

Como instalar e executar pip no cluster do Google Dataproc

Como instalar pacotes Python em um ambiente específico?

Como executar um algoritmo paralelo Java no cluster do Google Dataproc?

Como instalar pacotes Python em ambiente Linux?

Como instalar o módulo Python do NEST em um diretório de pacotes de sites específico?

Como faço para instalar bibliotecas Python automaticamente na inicialização do cluster Dataproc?

Como instalar pacotes dentro de um projeto em python usando linha de comando no Windows?

Como instalar pacotes python em um ambiente virtual sem baixá-los novamente?

Como consigo um trabalho de ativação para usar todos os recursos disponíveis em um cluster do Google Cloud DataProc?

Como instalar pacotes extras na VM do Google Colaboratory?

usar uma biblioteca externa no trabalho pyspark em um cluster Spark do google-dataproc

Como instalar pacotes Python e Python na VM do Azure?

instalar pacotes python para um interpretador diferente (mudando do anaconda)

Instale pacotes em um cluster

Como instalar o Apache Zeppelin em um cluster autônomo existente do Apache Spark

Como instalar o Apache Zeppelin em um cluster autônomo existente do Apache Spark

Como instalar uma biblioteca em um cluster de databricks usando algum comando do notebook?

Como ativo o suporte ao codec Snappy em um cluster Spark iniciado com o Google Cloud Dataproc?

Como criar um grande cluster (dataproc) no Google Cloud Platform com uma cota de endereços IP em uso muito limitada?

Como armazenar o resultado da consulta do Google Dataproc em um GCP variável

Como instalar todos os pacotes em JuliaStats?

Como forçar devtools a instalar pacotes em remotos

Como instalar pacotes ansible yum em ordem

Como instalar modelos / baixar pacotes no Google Colab?

Como instalar o R em um cluster Linux?

Como instalar uma biblioteca em um cluster automatizado Databricks

Como instalar uma biblioteca em um cluster automatizado Databricks

Como instalar um pacote seletivo em um projeto pypi que possui vários pacotes?

TOP lista

quentelabel

Arquivo