OKKY - 'pyspark' 관련 질문 목록 | OKKY

커뮤니티 Q&A 지식 이벤트 Contact

로그인 회원가입

카테고리

커뮤니티
모임·스터디
Q&A
지식
이벤트
공지사항
Contact

pyspark

questions

questions

해결
1
noell·2년 이상
524
0
해결 1
pyspark sparkcontext 브로드캐스트 변수, 액션 또는 변환에서 참조시 PySparkRuntimeError
# 클러스터링 결과를 기반으로 데이터를 그룹화하고, 각 클러스터의 데이터 수를 계산합니다. clusterData = trainData2.map(lambda point: (model.predict(point), 1)) clusterSizes = clusterData.reduceByKey(lambda a, b: a + b).collect() 위 코드를 이용하여 클러스터링한 결과를 그룹화 하고싶은데, 다음의 오류가 발생하며 스파크 콘
해결
1
cosician·3년 이상
934
0
해결 1
신입 데이터 엔지니어 포트폴리오 피드백 부탁드리겠습니다 !
노션으로 포트폴리오를 만들었습니다.현재 여러 회사에 지원을 하고 있는데 대부분 서류에서 탈락이 되어선생님들의 다양한 피드백으로 도움을 얻고자 글을 작성하였습니다 .혹 시간이 있으시다면 귀한 시간 내주시면 감사하겠습니다 :) !피드백 감사합니다!
해결
2
kyounghunJang·약 4년
336
0
해결 2
(pyspark or pandas) df to csv 질문
img src="//file.okky.kr/images/1659417612669.png" style="width:100%
답변
1
mors·거의 6년
486
0
답변 1
리눅스 pyspark 메모리 사용량 질문드립니다
동일한 파이썬 프로그램을 윈도우에서 올렸을때는 작업관리자에25000K 메모리 사용량이 표시되고,리눅스에서 실행 후, cat /proc/PID/status | grep VmSize 를 실행하였을때는VmSize: 3600000kB 라는 수치를 표시해주는데VmSize가 실제 메모리 사용량이 아닌것인지, 아니면 단

All That Developer

Facebook Youtube Email

회사소개
공지사항
연락처
광고문의

운영정책 슬랙봇

개인정보 처리방침
통합 서비스 이용약관

운영정책 슬랙봇

상호명: (주)오키코리아 | 대표명: 노상범

사업자등록번호: 592-87-02037
| 통신판매업신고번호: 제 2022-서울강남-04742호
| 직업정보 제공사업 신고번호: J1200020230009

주소: 서울 강남구 봉은사로 303 TGL경복빌딩 502호 (06103)
| 고객센터 : info@okky.kr (영업시간 평일 10:00~17:00) 주말 · 공휴일 휴무

© 2026 (주)오키코리아. All rights reserved.

sponsored by

iNames

iNames

NHN Cloud

NHN Cloud