언어과학회•배달말 학회 공동 겨울 워크숍 안내:
국어 연구자와 영어 연구자를 위한 파이썬(Python) 기반 언어 분석 기초 강좌
언어과학회와 배달말 학회가 공동으로 자연어(영어, 한국어 등)를 컴퓨터로 처리하는 NLP(Natural Language Processing)를 위한 프로그램을 배우는 워크숍을 마련하였습니다.
이 강좌는 Python 프로그래밍 언어와 영어 텍스트를 다루는 데 필요한 Natural Language Toolkit(NLTK)이라는 오픈 소스 라이브러리, 한국어 텍스트를 이용한 기초적인 NLP 작업 수행을 위한 오픈 소스 라이브러리인 KoNLPy를 기반으로 합니다. 실제 데이터를 수집/추출하여 분석 단계를 준비하는 데이터 전처리 과정(Preprocessing Step), 토큰화/토크나이징(Tokenization), 빈도수 분석을 배울 수 있습니다.
한국어, 영어 등의 언어학과 언어 교육 전공의 교수님들과 대학원생들의 많은 참여를 바랍니다.
1. 일시 : 2020년 1월 30일(목) 오후 2시-5시
2. 장소 : 경남과학기술대학교 100주년 기념과 1301호 컴퓨터실
3. 강사 : 김민호 연구원(부산대학교 SW 교육센터 교수)
4. 대상 : 각 학회 회원 및 관심 있는 대학원생
5. 등록
1) 등록비 : 없음
2) 선착순: 40명 제한(첨부 파일 참조)
3) 등록방법: 이메일로 사전 신청 및 등록(lingusociety2@daum.net)만 가능합니다. 이메일 신청에 문제가 있으면, 언어과학회 총무간사 조은정(010-2018-2096)에게 문자를 남겨 주시기 바랍니다.
6. 세부일정표 :
시간 |
1월 30일(목) |
강사 |
14:00-17:00 |
파이썬(Python)을 활용한 언어 분석 기초: 전처리, 토큰화(토큰나이징), 빈도 |
김민호 (부산대) |
7. 각 실습별 주요내용:
본 실습에서는 파이썬(Python)을 이용한 언어 연구 방법의 기초를 상세히 설명하여, 참가자가 실제로 언어 자료를 이용하면서 기초적인 연구를 수행할 수 있도록 안내한다.
원시 말뭉치(raw corpus)를 대상으로 품사 태깅(POS tagging)을 수행한 다음 단어 빈도 목록, 누적 빈도, 타입/토큰 비율(TTR) 등을 구하는 방법을 제시한다.
컴퓨터 비전공자도 쉽게 따라 할 수 있도록 파이썬이라는 프로그래밍 언어의 문법을 익히는 일에 중점을 두지 않고, 언어 분석 도구로서 파이썬을 사용할 수 있도록 한다.
8. 공동주최: 언어과학회, 배달말 학회
9. 주관: 언어과학회