지난편 요약,
1. 나도 뭔가 가치있는 일을 해보자.
2. 커뮤를 탈탈 털어서 “소수의 헤비업로더가 여론을 주도하더라“ 라는 가설을 정량적으로 증명해보려고 함.
3. 크롤링에 너무 오랜 시간이 걸림.

https://m.inven.co.kr/board/webzine/2097/2473628?my=post

본편,
사실 개인 컴퓨터로 작업을 했었음.
엄청 느렸지만 어째저째 크롤링은 완료했음ㅋㅋㅋ
여기서 이슈사항이 또 발생함.
데이터만, 0.8TB.....
(당신들 미치셨어요? 오이갤에 글이 이렇게 많다고?)

분류모델 만들고 정량적 평가 모델 만들려고 시도중,
컴퓨터가 뻗어버림..

어쩔수없이 회사 워크스테이션에 아나콘다 설치함.
아까 오전에 한 직원이
“님 뭐하심??“
“워크스테이션에 왜 아나콘다를 깔고 난리냐?“
“코어 니혼자 다 쓸래?“
세문장의 눈빛으로 쳐다봄

얼마나 걸릴지 아직은 미지수 ㅋㅋㅋ
추후 진행사항 공유하겠음.