Korpora
latest version: 0.2.0rc1 (pre-release)
한국어 안내 (For Korean)
코포라 소개
1. 개발 목적
2. 설치 방법
3. 빠른 사용법
제공하는 말뭉치 목록
1. 챗봇 문답 페어
2. KcBERT 댓글 데이터
3. 한국어 혐오 데이터셋
4. 청와대 국민청원
5. KorNLI
6. KorSTS
7. 한국어 위키 텍스트
8. 나무 위키 텍스트
9. 네이버 x 창원대 NER 데이터
10. NAVER Sentiment Movie Corpus
11. 한국어 질문쌍
12. 한영 병렬 말뭉치
13. 모두의 말뭉치: 신문
14. 모두의 말뭉치: 메신저
15. 모두의 말뭉치: 형태 분석
16. 모두의 말뭉치: 개체명
17. 모두의 말뭉치: 구어
18. 모두의 말뭉치: 웹
19. 모두의 말뭉치: 문어
20. AI Hub 한국어-영어 번역 말뭉치
21. 영화 자막 한영 병렬 말뭉치
Metrics: 모델 평가
1. 평가 파이프라인
2. ko-BERTScore
3. ko-BLEURT
프로젝트 기여
1. 이슈 작성 가이드라인
2. Pull Request 방법
영문 안내 (For English)
What is Korpora
1. Motivation
2. Installation
3. Quick Tour
Corpus List
1. Korean Chatbot Data
2. KcBERT Pre-Training Corpus
3. Korean Hate Speech Dataset
4. Korean Petitions
5. KorNLI
6. KorSTS
7. Korean WikiText
8. NamuWikiText
9. NAVER x Changwon NER
10. NAVER Sentiment Movie Corpus
11. Korean Question Pair
12. Ko-En Parallel Corpus
13. Modu: Newspaper
14. Modu: Messenger
15. Modu: Morphemes
16. Modu: Named Entity
17. Modu: Spoken
18. Modu: Web
19. Modu: Written
20. AI Hub Ko-En Parallel Corpus
21. OpenSubtitles2016
Metrics : Evalutation
1. Pipeline
2. ko-BERTScore
3. ko-BLEURT
Contribution
1. Issue Templates
2. How to Pull Requests
Korpora
en-docs
metrics
pipeline.md
Pipeline
TBD
Next
© Copyright 2020,
ko-nlp
Korpora
pages
GitHub
Repository
Issues
Download
Statistics
Total visits:
Built with
jekyll-rtd-theme
provided by
RunDocs