핵심 문제점
현재 기계발췌에서 자주 발생하는 세 가지 주요 문제:
🔸 첫 번째 문제: 메타 정보 중심 발췌
보고서의 실제 내용(배경, 요약, 결론, 함의) 대신 보고서 구성을 단순히 소개하는 메타 정보만을 발췌
예: 이 보고서는 배경, 요약, 결론, 함의로 구성되어 있다.
이런 발췌는 실질적 정보를 제공하지 않기에 부적합
🔸 두 번째 문제: 기계의 관점 개입
원문의 객관적 사실을 넘어 기계가 주관적 해석 및 긍부정적 평가를 덧붙이는 문제
예: '차별성을 가지며', '깊이와 활용도를 높이고 있다' 등의 가치 판단적 표현 사용
예: '이러한 조치 없이는 연방군의 지속적인 작전 능력 확보가 어렵다는 점을 보고서는 분명히 밝힌다.' 발췌에 없는 내용을 추론
🔸 세 번째 문제: 나열식 번역으로 인한 가독성 저하
기계번역의 나열식 패턴으로 인해 지나치게 긴 주어와 호흡이 발생하여 가독성 저하
예: '1, 2, 3, 4, 5, 6, 7, 8을 특징으로 한다' 형태의 과도한 나열식 구조
기계발췌 PROMPT 원칙
- 배경 내용 자체를 서술 (배경을 제시한다O 구성 설명 ❌)
- 요약 내용 자체를 서술 (요약을 공유한다O 구성 설명 ❌)
- 결론 내용 자체를 서술 (결론을 담는다O 구성 설명 ❌)
- 함의 내용 자체를 서술 (함의를 포함한다O 구성 설명 ❌)
- 구성 설명 예시 : 이 보고서는 배경, 요약, 결론, 함의로 구성되어 있다.❌
- 객관적 사실 서술을 유지 (기계의 주관적 해석이나 가치 판단 배제)
- 원문에 충실한 사실 설명형(나열형 ❌) 문장으로 정리
- 설명식 문장 구조 사용 (과도한 나열식 구조 지양)
- 적절한 문장 호흡 유지 (가독성 고려한 문장 길이 조절)
잘못된 발췌 사례 분석
🔸 첫 번째 문제: 메타 정보 중심 발췌
잘못된 발췌:
The document includes practical examples, financing mechanisms, and an annex categorizing AT by impairment type.
문제점: 이 문장은 문서에 뭐가 포함되어 있는지만 설명할 뿐, 실제 정책 내용이나 연구 결과는 전혀 없음
잘못된 발췌:
The document is organized into sections covering the introduction, methodology and results, and conclusions with policy recommendations. It also includes an annex detailing technical model specifications, equations, and data sources used in the analysis.
문제점: 논문의 구조, 메타 구성 정보만 나열, 실제 연구 결과나 핵심 발견사항을 발췌해야 함
잘못된 발췌:
The paper includes simulations... Annexes provide additional detail on regulatory principles relevant to the proposed reforms.
문제점: 부록 언급❌, 부록의 '내용 자체'는 표제,결과,함의와의 연계선상에서 설명식 언급은 가능O 'Annexes', 'Appendix' 단어 사용x
올바른 발췌 방식
올바른 발췌:
The paper is structured into sections covering emission heterogeneity, economic modeling of policy tools, and policy recommendations, highlighting that carbon pricing is more effective and fiscally sustainable.
장점: 실제 목차 제시 및 구체적 발견사항을 제시
🔸 두 번째 문제: 기계의 관점 개입
잘못된 발췌:
특히, 이 보고서는 정밀한 평가와 실행 중심의 전략을 결합한 점에서 차별성을 가지며, 부록과 시각화 자료를 통해 분석의 깊이와 활용도를 높이고 있다.
문제점 분석:
- '차별성을 가지며' → 가치 판단 → 특정 요소가 특별하다고 '평가'하고 있음
- '분석의 깊이와 활용도를 높이고 있다' → 기계의 긍정적 관점 개입 → 단순히 자료가 포함되었다는 사실을 넘어, '깊이'와 '활용도'가 '향상된다'는 긍정적 평가를 덧붙임
결론: 객관적 사실 서술이 아니라 기계의 주관적 해석 및 평가 개입으로 볼 수 있음
올바른 발췌:
이 보고서는 구체적인 평가와 실행 중심의 전략을 결합한다.
장점: 기계의 가치 판단 및 긍정적 평가를 배제하고, 원문에 충실한 사실 중심 문장으로 정리
발췌:
Der Bericht betont, dass es jetzt schnellen politischen Willen, weniger Bürokratie und klare Prioritäten braucht, um die Einsatzfähigkeit dauerhaft zu sichern.
문제점 분석:
- 이 문제를 해결하기 위해 정치적 결단력, 관료주의의 과감한 축소, 분명한 우선순위 설정이 시급하다고 지적한다. '이러한 조치 없이는 연방군의 지속적인 작전 능력 확보가 어렵다는 점을 보고서는 분명히 밝힌다.' → 가치 판단 → 추론하여 생성한 문장
- → 기계의 추론이나 관점 개입 → 발췌에서 밝히는 사실을 넘어, '~없이는', '분명히 밝힌다'는 추론을 덧붙임
결론: 객관적 사실 서술이 아니라 기계의 주관적 해석 및 평가 개입으로 볼 수 있음
🔸 세 번째 문제: 나열식 번역으로 인한 가독성 저하
원문:
The report's recommendations aim to further enhance coordination, digital transformation, and user experience.
잘못된 번역 (나열식):
이 보고서의 권고사항은 기관 간 협력 강화, 디지털 전환 심화, 사용자 경험 개선 등을 통해 VUI의 기능을 한층 고도화하는 데 목적이 있다.
문제점:
- 지나치게 긴 주어 → '기관 간 협력 강화, 디지털 전환 심화, 사용자 경험 개선 등을' 과도한 나열
- 긴 호흡의 문장 → 한 문장에 너무 많은 정보를 압축하여 가독성 저하
- 기계적 나열 패턴 → '1, 2, 3, 4, 5를 특징으로 한다' 형태의 획일적 구조
올바른 발췌:
The report proposes enhancing VUI capabilities by strengthening inter-agency collaboration, deepening digital transformation, and improving user experience.
이 보고서는 기관 간 협력을 강화하고, 디지털 전환을 심화하며, 사용자 경험을 개선하는 방안을 통해 VUI의 기능을 한층 고도화할 것을 제안한다.
장점: 나열형 긴주어 사용❌, 원문에 충실한 사실 중심 설명형 문장으로 정리
Prompt 지침(안)
첫 번째 문제 해결방안 (메타 정보 중심 발췌):
- 구성 및 목차만(소개, 부록 등)을 나열하는 발췌 작성 방식❌
- 실제 목차의 '내용'을 가져오는것은 가능O
- 결론과 함의, 정책 효과의 맥락과 일치하는 구체적 연구 범위는 언급 가능O
두 번째 문제 해결방안 (기계 관점 개입):
- 기계의 가치 판단 및 긍정적 평가 표현 배제❌
- '차별성', '깊이 향상', '활용도 증대' 등의 주관적 해석 금지❌
- 원문에 충실한 객관적 사실 서술로 제한O
- 단순 사실 나열형 문장으로 정리O
세 번째 문제 해결방안 (나열식 번역 문제):
- 과도한 나열식 구조 지양❌ (1, 2, 3, 4, 5를 특징으로 한다 패턴)
- 설명식 문장 구조 사용O (연결어를 활용한 자연스러운 흐름)
- 적절한 문장 호흡 유지O (가독성을 고려한 문장 길이 조절)
- 지나치게 긴 주어 분할O (복합 주어를 명확한 단위로 구분)
번역/감수 단계에서:
- 구성 소개글을 이미 발췌한 경우 recheck 진행
- 기계번역 단계에서 실제 내용으로 대체하여 납품
- 기계의 주관적 해석 및 평가 표현 제거
- 실질적 정보를 제공하는 지 최종 점검
체크리스트
발췌문이 다음 중 하나라도 해당되면 잘못된 발췌:
🔸 첫 번째 문제 체크포인트 (메타 정보 중심)
- 문서의 구조나 구성만 설명
- 'structured', 'organized' 뒤 메타 설명어(introduction, summary, etc)만 사용❌
- 메타 설명만 나열하고 실제 연구 결과나 정책 내용 이 부재한 경우
🔸 두 번째 문제 체크포인트 (기계 관점 개입)
- '차별성', '특징적', '깊이 향상' 등 가치 판단적 표현 사용❌
- 기계의 긍정적 평가나 해석이 덧붙여진 경우❌
- 원문의 객관적 사실을 넘어선 주관적 서술❌
🔸 세 번째 문제 체크포인트 (나열식 번역)
- 과도한 나열식 구조 (1, 2, 3, 4, 5를 특징으로 한다 패턴)❌
- 지나치게 긴 주어와 복잡한 문장 구조❌
- 긴 호흡으로 인한 가독성 저하❌
- 기계적 번역 패턴으로 인한 부자연스러운 문장❌
🔸 공통 체크포인트
- 전달하는 실질적 정보 없음