워드프레스 호스팅 클라우드웨이즈 1년 사용기
페이지 정보

본문
8월 워드클라우드 중순 휴가를 다녀온 이후 진행중이던 연구 2개의 보고서를 작성하느라 조금 바쁜 시간이었다. 보고서를 작성하면서 AI비서를 어떻게 활용했는지 기록을 남겨보려 한다. 연구 하나는 인터뷰를 진행하고 #내용분석까지 진행되었던 #질적연구이다. 최종보고서 작성을 위해 인터뷰 내용을 다시 검토하면서 의미 있는 인용 구문을 찾아 보고서에 담는 작업이었다. 그래서 이 부분은 그냥 연구자의 몫이다. 연구를 의뢰한 곳의 실무자들을 만나 인터뷰를 한번 더 진행했다. 연구물을 사용할 곳의 정확한 니즈(필요)를 알아야 보고서가 그냥 책장에 꽂히지 않고 실제로 도움이 될테니 말이다. 이 과정에서는 ‘네이버 클로바노트’가 아주 유용하다. 지난번 활용기를 쓴 이후 워드클라우드 변화가 있었다. (단어 바꾸기 기능이 추가되었다.)보고서 작성을 위해 마지막 남은 작업은 #워드클라우드 를 만드는 작업이다. 내가 사용하는 프로그램인 Nvivo에서도 워드클라우드를 만들어준다. 하지만 영어를 기준으로 만들어진 프로그램이라서 한글의 의미없는 단어를 삭제하고, 같은 의미의 유사 단어를 통합하는 과정이 너무 노가다!? 너무 귀찮고 많은 시간이 소요된다. 그래서 이 과정을 AI 비서에게 맡겨보기로 한다. 먼저 #ChatGPT 4.o를 활용해서 인터뷰가 진행된 6곳의 6개 파일을 하나로 통합하고,인터뷰 진행자가 한 말들은 지우고, 인터뷰 참여자들의 응답 부분만 내용으로 남겨두었다. (파일을 통합하는 과정에서 .doc 파일로 저장되었던 하나의 파일을 .docx 파일로 바꿔서 워드클라우드 업로드 해야 했다. )279페이지의 분량이 된 하나의 파일에서 인터뷰 진행자 내용을 삭제하니, 197페이지로 줄어들었다.여기서 주의해야 할 부분은 '어디에서, 어디까지 삭제할 부분인지'를 명확하게 지시해야 한다. (여기서도 서너번 프롬프트를 수정해야 했다)다음 인터뷰 텍스트에서 데이터 분석을 위한 전처리 작업을 수행해 주세요. 1. **불필요한 데이터 삭제** - 질문 부분(예: 인터뷰어:, 질문:, 어떤 어려움이 있나요?"등)을 삭제 - 감탄사 및 반복적인 표현(예: 음..., 그렇죠, 아, 네, 뭐..., 그러니까) 제거 - 문맥상 중요한 정보를 담고 있지 않은 불필요한 문장 삭제 2. **의미 없는 단어 및 중복 표현 제거** - 워드클라우드 조사 및 접속사 최소화(예: 그래서, 그러면, 그러니까"등의 불필요한 연결어 제거) - 동어 반복 및 불필요한 문장 압축(예: 경제적으로 어렵고, 돈이 부족하고 힘들어요."→ 경제적으로 어렵다.) - 의미가 동일한 표현을 정리(예: 아플 때 병원 가는 게 두려워요. 응급 상황이 생길까봐 걱정돼요."→ 아플 때 응급 상황이 걱정된다.) 3. **형식 정리** - 응답자 ID(이름 제외), 성별, 연령, 직업, 거주 형태 유지 - 응답 내용은 간결하고 의미가 명확하도록 정리 4. **출력 예시** 원본 데이터: 위의 기준을 적용하여 인터뷰 데이터를 정제해서 워드파일로 주세요.챗지피티 프롬프트이제 분석할 인터뷰 파일이 준비되었다. 워드클라우드 그럼 워드클라우드를 만들기 위해 필요한 작업은 무엇일까? 이러한 과정도 ChatGPT가 친절하게 설명해 준다.ChaGPT 의 설명한글처럼 의미 단어(명사) 뒤에 조사가 붙어서 다른 단어가 되어버리는 문법적 구조에서는 #토큰화 작업이 참 어렵다.우선 아래의 프롬프트에 몇번의 수정을 거쳐 토큰화 작업이 수행되었다. (그런데 대표적인 은,는, 이, 가를 분리하는 이 과정에서 다시 합쳐주어야 할 단어들도 생긴다. 예를 들어 국 가 =>국가로 어린 이 =>어린이)의미 있는 단어를 토큰화 하기 위해서 먼저 단어와 붙어 있는 조사를 띄어쓰기 할거야. 단어의 마지막 글자가 '은, 들은, 로, 으로, 는, 이, 들이, 들을, 나, 워드클라우드 한, 가, 도, 의, 과, 들과, 에, 에서, 에게, 으로, 하기, 하는, 했고'로 끝나면 마지막 글자 앞에 빈칸(space)을 하나씩 넣어줘. 수정된 단어는 파란색 글씨로 바꾸고, 파일을 다운받을 수 있게 저장해줘.토큰화 과정 프롬프트불필요한 단어인 #불용어제거 하는 작업도 몇번에 거쳐 수행되었다. 그래도 문서에서 '찾아_바꾸기'를 반복하는 수고보다는 훨씬 단축되는 것 같다. 이렇게 프롬프트를 만들어두면 다음엔 더 쉽겠지?불용어를 제거할거야. 지워줄 불용어는 '이제, 이런, 그런, 그러면, 근데, 그런데, 그리고, 그럼, 이렇게, 그렇게, 저렇게, 저희 도, 저희 는, 저희 들이, 이거 를, 저희 가, 이게, 보니까, 그러니까, 그래서, 워드클라우드 거기서, 있고, 제가, 저는, 거를, 그거를, 그냥 , 그래도, 거는, 그거는, 그걸, 것들이, 거고, 내가, 우리 도, 우리 가, 우리 의, 우리 는, 우리 처럼, 이때, 그때'를 지워줘 불용어 제거 프롬프트드디어 워드클라우드를 만들어 달라고 부탁했다. 하지만 역시 #시각화 단계에서 ChatGPT의 가장 큰 걸림돌은... 한글이 깨지는 문제이다. 예전에 한번 테스트로 돌려봤을 때도 그러더니... 여전히 네모네모한 그림이 나왔다. 그래서 폰트를 주고 다시 만들어 달라고 하면, 이건 좀 아니다! 여전히 두드러지게 나온 의미 없는 단어들.워드클라우드를 만들때 제외시킬 단어를 몇번에 거쳐 다시 알려주고, 드디어 최종 결과물은 워드클라우드 이렇게 나왔다.그리고 관련어들과의 관계망을 보고 싶어 만든 이 도표를 만드는 작업에서도 한글이 깨지는 게 문제다. 문제!! ㅠㅠ어째됐든 AI비서를 통해 누구나 할 수 있는, 시간을 많이 절약할 수 있는 과정이라 생각된다. 여러분들도 한번 도전해보시길~~!! ^^
- 이전글대구강아지분양 테디럽 아직도 돈주고 입양하세요? 25.02.27
- 다음글아노'라고 불러왔다고 주장했다. 25.02.27
댓글목록
등록된 댓글이 없습니다.