PDF 저작권·라이선스 다국어 스캔
snl_ccl.txt (Bash 스크립트)
설명
PDF를 텍스트로 뽑은 뒤, CC·저작권·다국어 키워드를 줄 단위로 찾아 원문 + 한국어 병기로 터미널에 출력합니다.
기술 스택
- Bash
pdftotext (Poppler)
- awk
결과 예시
[원문] This work is licensed under CC BY-NC 4.0.
[병기] ▸ cc by-nc → CC BY-NC (저작자 표시-비영리)
[원문] All rights reserved.
[병기] ▸ all rights reserved → 모든 권리 보유