[Spark][setting] Spark Installation(Windows 10)

April 23, 2022

자바 설치

Oracle 회원가입 (로그인 필요)
다운로드 파일 : https://www.oracle.com/java/technologies/javase/javase8u211-later-archive-downloads.html
관리자 권한으로 다운로드 파일 실행.
Next 버튼을 클릭 후 설치 경로 설정에 관하여 나온다.
- 초기 설정 : C:\Program Files\Java\jdk1.8.0_301\
- 이 경로를 변경 → C:\jdk
  - 경로 이름 중에 공백이 있으면 환경 설치 시 문제 발생 가능성 있음.
다시 Next 버튼을 클릭 후, 자바 런타일 환경의 폴더의 경로도 변경해준다.
- 초기 설정 : C:\Program Files\Java\jre1.8.0_301\
- 이 경로를 변경 → 해당 드라이브에 jre폴더 생성 → C:\jre 로 설정

Untitled

(본인은 C드라이브 용량의 문제로 D드라이브에 저장을 했다.)

Untitled

(Spark 버전을 확인 후 기억해 둔다.)

Untitled

표시된 곳을 선택하여 다운로드를 실행한다.

다운로드한 Spark가 .tgz 형식의 압축파일이므로 WinRAR을 설치.
- 다운로드 파일 : https://www.rarlab.com/download.htm
컴퓨터 환경에 맞는 파일을 선택한 후 다운로드를 진행한 후, 설치를 진행한다.

Untitled

Untitled

Untitled

해당 파일을 메모장으로 연다.

Untitled

스파크가 윈도우 로컬 컴퓨터가 Hadoop으로 착각하게 만들 프로그램 필요
- 다운로드 파일 : https://github.com/cdarlint/winutils
- spark의 버전에 맞추어 다운로드한다.
설치할 드라이브에 winutils 폴더를 생성 후, 그 폴더 내에 bin 폴더를 생성한다.
bin 폴더 내에 다운로드한 파일을 저장한다.

Untitled