Python3调用Google翻译

时间:2022-07-23
本文章向大家介绍Python3调用Google翻译,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

类似前言一样的东西

想弄一个批量翻译的东西,奈何百度翻译别人根本不研究,所以只能看谷歌翻译的了;这份代码的作者写的太聪明了,是真的很棒,思路很好,看到这样的代码简直年轻10岁

环境

这翻译的环境需要

  • Python 3.5.4
  • urllib (安装方法: pip install urllib5)
  • execjs (安装方法: pip install PyExecJs)
  • requests (安装方法: pip install requests)
  • termcolor (安装方法: pip install termcolor)

思路分析

直接在google翻译的url上拼接语句是不可行的,google在其中有一个关键参数tk,这个参数是利用js算出来的,不同的内容不同的值,然而还是有大佬把tk值得算法代码写出来了,下面是GitHub的链接

https://github.com/cocoa520/Google_TK

膜拜一波大佬

正题开始

先把tk值得算法搬出来

考虑到可能会拒绝连接,所以得伪造报头,伪装成浏览器的 这里用的是谷歌浏览器

def open_url(url):
    headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36'}
    req = requests.get(url=url, headers=headers)
    return req.content.decode('utf-8')

翻译的字符长度是有限制的,测试出来的结果是不能大于4891,这里在def一个限制长度的

def max_length(content):
    if len(content) > 4891:
        print("翻译文本超过限制!")
        return

下面这个def是最重要的,因为直接输出的结果,是一大串列表属性的内容,如下图

看的就很难受,所以这里要把不必要的东西都过滤掉,只要翻译

def print_result(parm):
    result = parm
    str_end = result.find("",") #查找字符串 号开始,号结束
    if str_end > 4:
        print("翻译的结果为:",result[4:str_end]) #输出结果截取,只要翻译的一部分

接下来就把上面定义的都给调用起来,分两块,一块是英译中,一块是中译英

def en_to_zn_translate(content, tk):
    max_length(content) #content是后面自己input的字符串
    content = urllib.parse.quote(content) #转换成url编码
    #英译汉
    url = "http://translate.google.cn/translate_a/single?client=t" 
          "&sl=en&tl=zh-CN&hl=zh-CN&dt=at&dt=bd&dt=ex&dt=ld&dt=md&dt=qca" 
          "&dt=rw&dt=rm&dt=ss&dt=t&ie=UTF-8&oe=UTF-8&clearbtn=1&otf=1&pc=1" 
          "&srcrom=0&ssel=0&tsel=0&kc=2&tk=%s&q=%s" % (tk, content)
    result = open_url(url) #请求网址
    print_result(result)#输出结果

汉译英差不多的,只是Url中的一些参数变了而已

def zn_to_en_translate(content,tk):
    max_length(content) #content是后面自己input的字符串
    content = urllib.parse.quote(content) #转换成url编码
    #汉译英
    url = "http://translate.google.cn/translate_a/single?client=t"
          "&sl=zh-CN&tl=en&hl=zh-CN&dt=at&dt=bd&dt=ex&dt=ld&dt=md&dt=qca"
          "&dt=rw&dt=rm&dt=ss&dt=t&ie=UTF-8&oe=UTF-8"
          "&source=btn&ssel=3&tsel=3&kc=0&tk=%s&q=%s"%(tk,content)
    result = open_url(url) #请求网址
    print_result(result) #输出结果

接着弄个大整合,把这些全部都调用到一起,在这中间在分出模式选择,英译汉还是汉译英,下面就是各种调用了,算tk值,调用翻译等

def main():
    js = Return_tk()
    while True:
        print(termcolor.colored("请先输入要进行的操作:q表示退出;e表示英文翻译成中文;z表示中文翻译成英文。","red"))
        change = input("请选择翻译选项:")
        if change == 'q':
            print("再见")
            break
        elif change == 'e':
            content = input("请输入要翻译的英文:")
            tk = js.getTk(content)
            en_to_zn_translate(content,tk)
        elif change ==  'z':
            content = input("请输入要翻译的中文:")
            tk = js.getTk(content)
            zn_to_en_translate(content,tk)
        else:
            print("请输入正确的选项!")

main()

完整的代码太长了,有需要的话可以上我的Github[https://github.com/Ernket/Google-Translate]里面下载,有了这个翻译的就可以爬去一些英文的目录,自动翻译了,舒服的