Pandas DataFrame의 내부 행 방식 연산

BrenBarn

내가 이것을 가지고 있다고 가정하십시오.

>>> x = pandas.DataFrame([[1.0, 2.0, 3.0], [3, 4, 5]], columns=["A", "B", "C"])
>>> print x
   A  B  C
0  1  2  3
1  3  4  5

이제 x행별로 정규화하고 싶습니다. 즉, 각 행을 합계로 나눕니다. 에 설명 된대로 이 질문 이이 달성 될 수있다 x = x.div(x.sum(axis=1), axis=0). 그러나 이것은 새로운 DataFrame을 생성합니다 . 내 DataFrame이 크면 즉시 원래 이름에 할당하더라도이 새 DataFrame을 만드는 데 많은 메모리를 사용할 수 있습니다.

이 작업을 수행하는 효율적인 방법이 있습니까? 나는 그와 같은 옵션 x.idiv()을 제공 하지만 업데이트 를 원합니다 . 이 특정 경우에는 부서가 필요하지만 때로는 모든 기본 작업에 대해 유사한 내부 버전을 사용하는 것이 좋습니다.axisdivx

(행별로 반복하고 정규화 된 각 행을 원본에 다시 할당하여 제자리에 업데이트 할 수 있지만 속도가 느리고보다 효율적인 솔루션을 찾고 있습니다.)

앤디 헤이든

사본을 만들지 않고 numpy에서 직접 수행 할 수 있습니다.

In [11]: x1 = x.values.T

In [12]: x1
Out[12]: 
array([[ 1.,  3.],
       [ 2.,  4.],
       [ 3.,  5.]])

In [13]: x1 /= x1.sum(0)

In [14]: x
Out[14]: 
          A         B         C
0  0.166667  0.333333  0.500000
1  0.250000  0.333333  0.416667

아마도 div에 대한 인플레 이스 플래그가 있어야할까요 ...?

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-03-17

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

다음 포스트：조건 하에서 정수를 인쇄하는 동안 루프

TOP 리스트

기사

Pandas DataFrame의 내부 행 방식 연산

Pandas DataFrame의 내부 행 방식 연산

C # 16 진수 값 0x12는 잘못된 문자입니다.

Matlab의 반복 Sortino 비율

librosa로 생성 된 스펙트로 그램을 다시 오디오로 변환 할 수 있습니까?

PhpStorm 중단 점에서 변수 값을 볼 수 없습니다.

종속 사용자 정의 Lightning 선택 목록 Level2 및 Level3을 설정한 다음 Lightning 구성 요소에서 Level2를 재설정하지만 Level2 캐시 데이터가 저장됨

Watchdog 큐 이벤트를 사용하는 Python 병렬 스레드

atob은 인코딩 된 base64 문자열을 디코딩하지 않습니다.

dev 브랜치에 병합 할 때만 트리거하도록 bitbucket에서 AWS Codebuild로 웹훅을 설정하려면 어떻게해야합니까?

2 개의 이미지를 단일 평면 이미지로 결합

Assets의 BitmapFactory.decodeStream이 Android 7에서 null을 반환합니다.

막대 그래프 위에 선이 표시되지 않음

Python : 특정 범위를 초과하면 플롯의 선 색상을 변경할 수 있습니까?

기능 선택을위한 Sklearn Chi2

Ionic 2 로더가 적시에 표시되지 않음

EventEmitter <string>의 컨텍스트 'this'가 Observable <string> 유형의 'this'메서드에 할당되지 않았습니다.

매개 변수에서 쿼리 객체를 선언하는 방법은 무엇입니까?

openCV python을 사용하여 텍스트 문서에서 워터 마크를 제거하는 방법은 무엇입니까?

아이디어 Intellij : 종속성 org.json : json : 20180813을 찾을 수 없음, maven에서 org.json 라이브러리를 가져올 수 없음

일반 메서드에서 클래스 속성에 액세스하는 방법-C #

식별자는 ORA-06550 및 PLS-00201로 선언되어야합니다.

함수 호출 사이에 데이터를 저장하는 파이썬적인 방법은 무엇입니까?