파이선으로 번역기를 돌려볼까 ?

파이썬 스크립트

파이선으로 번역기를 돌려볼까 ?

Billcorea 2022. 10. 6. 23:50

오늘은 영문 번역에 대한 이야기를 잠깐 해 볼까 합니다. 아직 테스트가 원활하지는 않지만, kakao에서 지원했던 번역 API는 2022.07.01 사용이 중지되어 기존 허용되었던 api 사용자에게는 2023.06.30까지만 지원한다고 합니다.

아무튼 현재 무료로 사용할 수 있는 번역 API는 구글, naver, kakao 등이 있습니다.

kakao가 지원하는 다음 버전의 번역API는 cloud에 포함되면서 개인이 사용하기에는 조금 더 장벽(?)이 있는 것처럼 보입니다. 좀 더 알아보아야겠지만요.

아무튼 코드는 다음과 같이 구현을 해 보았습니다.

# POST /v2/translation/translate HTTP/1.1
# Host: dapi.kakao.com
# Authorization: KakaoAK {REST_API_KEY}
# Content-type: application/x-www-form-urlencoded

# curl "https://openapi.naver.com/v1/papago/n2mt" \
# -H "Content-Type: application/x-www-form-urlencoded; charset=UTF-8" \
# -H "X-Naver-Client-Id: ..............." \
# -H "X-Naver-Client-Secret: ..........." \
# -d "source=ko&target=en&text=만나서 반갑습니다." -v

import os
import requests
import docx2txt
import urllib.request
import json

baseURL = 'https://dapi.kakao.com/v2/translation/translate'
naverURL = 'https://openapi.naver.com/v1/papago/n2mt'
apiKey = '....................' # 카카오 API 을 위한 키값 
# '.................'
trLng = 'kr'
basePath = 'D:/'

def translateNaver(pStr):
    client_id = "............"  # 개발자센터에서 발급받은 Client ID 값
    client_secret = "........"  # 개발자센터에서 발급받은 Client Secret 값
    encText = urllib.parse.quote(pStr)
    data = "source=en&target=ko&text=" + encText
    url = naverURL
    request = urllib.request.Request(url)
    request.add_header("X-Naver-Client-Id", client_id)
    request.add_header("X-Naver-Client-Secret", client_secret)
    response = urllib.request.urlopen(request, data=data.encode("utf-8"))
    rescode = response.getcode()
    if (rescode == 200):
        response_body = response.read()
        jsonStr = json.loads(response_body.decode('utf-8'))
        return jsonStr['message']['result']['translatedText']
    else:
        print("Error Code:" + rescode)
        return rescode

def translateKakao(pStr):
    headers = {'Content-type': 'application/x-www-form-urlencoded', 'Authorization': 'KakaoAK ' + apiKey}
    parameter = {'query': pStr, 'src_lang': 'en', 'target_lang': trLng}
    requests.packages.urllib3.disable_warnings(requests.packages.urllib3.exceptions.InsecureRequestWarning)
    req = requests.post(baseURL, data=parameter, headers=headers)
    json_str = ''
    if req.status_code == 200:
        json_str = req.json()['translated_text']
        json_str = str(json_str[0]).replace('[', '')
        json_str = json_str.replace(']', '')
        json_str = json_str.replace("'", "", 2)
    else:
        json_str = req.json()['message']
    return json_str


def docx_to_txt(path, filename):
    text = docx2txt.process(path + filename).split('\n')
    # docx 파일의 내용이 text에 담기는데 '\n' 줄바꿈 문자 기준으로 나뉘어 리스트로 만들어 진다.
    newfile = os.path.splitext(filename)[0] + '.txt'
    f = open(os.path.join(path, newfile), 'w', encoding='UTF-8')  # txt 파일 오픈(없으면 생성됨)
    for item in text:  # text에 담긴 [[Example01], [Hello], [Hi] ...]의 요소 하나가 txt파일에 한줄로 써지게 됨.
        f.write(item + '\n')
    f.close()
    return newfile  # {file}.txt가 리턴됨


newFile = docx_to_txt(basePath, '내문서파일.docx')
print(newFile)

f = open(os.path.join(basePath, newFile), 'r', encoding='UTF-8')
fw = open(os.path.join(basePath, 'outFile.txt'), 'w', encoding='UTF-8')

for line in f:
    if len(line.strip()) < 1:
        pass
    else:
        print("[" + line.strip() + "]" + str(len(line.strip())))
        if len(line.strip()) != 0:
            transStr = translateKakao(line.strip())
            print(transStr)
            fw.write(transStr)
            break

fw.close()
f.close()

print('Job END...')

이상의 코드는 docx 문서 파일에 영문 원본이 있다고 하는 경우 그 내용을 일단 text 파일로 변환을 하고 해당 text 파일에서 본문 내용을 읽어서 번역 API을 호출해 보는 방식입니다.

kakao을 호출하는 부분과 naver 을 호출 하는 부분을 따로 함수를 만들어 보았는데, 물론 구글링을 해서 얻은 소스들입니다. 일정 부분 테스트를 거치면서 수정이 되기는 했지만요.

또 하나는 kakao는 번역을 지원하는 쿼터가 1일 50000자, 네이버는 10000자의 제한이 있습니다. 그 이상이 되면 번역을 해 주지 않습니다. ㅠㅠ;;

구글도 번역 api가 있는 기 한데, 설정에 대한 이해가 아직이라 알게 되면 정리를 다시 해 보겠습니다.

저작자표시 (새창열림)

'파이썬 스크립트' 카테고리의 다른 글

나도 코딩의 파이썬 입문 - 도서 소개 (26)	2023.02.23
파이썬으로 하는 이미지 변환 jpg to GIF 만들기... (5)	2023.02.09
파이썬으로 딥 러닝 ... (2)	2022.07.17
파이썬 따라 하기 : 인스타그램 봇... (0)	2022.02.15
파이썬 으로 로또 번호나 만들어 볼까 ? randint 와 random 의 차이는 뭘까 ? (3)	2022.02.10

현재글파이선으로 번역기를 돌려볼까 ?

👉android app's 개발 및 유지보수 지원 (kotlin, jetpack compose 기반) 👉보유기술 : android, java, kotlin, jetpack compose, sqlite, room, firebase, retrofit, ktor 👉잊어버릴 것 같은 이야기 정리 하기, 사는 이야기 정리 하기 👉 2020.12.13 블로그 시작 👉 threads 바로가기 https://www.threads.net/@help.billc

Retrofit, 개발일기, 내돈내산, 자동글쓰기, compose, 앱개발, 글쓰기, Kotlin, 챗봇, Android, Python, AI, 앱설명서, billcorea, ChatGPT, 파이썬, 안드로이드, JetpackCompose, Jetpack, 앱만들기,

Today :
Yesterday :

생각저장소 (배움의길에서 만나는 이야기)