调用谷歌翻译接口_api如何调用

调用谷歌翻译接口_api如何调用在平时使用谷歌翻译的过程中,经常会遇到需要批量翻译大量文本的情景,这种时候需要调用谷歌翻译的API首先可以使用python库googletranspipinstallgoogletrans#使用方法fromgoogletransimportTranslatortranslator=Translator(service_urls=[‘translate.google.cn’])sour…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

在平时使用谷歌翻译的过程中,经常会遇到需要批量翻译大量文本的情景,这种时候需要调用谷歌翻译的API

首先可以使用python库googletrans

pip install googletrans

#使用方法

from googletrans import Translator

translator = Translator(service_urls=[‘translate.google.cn’])

source = ‘我还是不开心!’

text = translator.translate(source,src=’zh-cn’,dest=’en’).text

print(text)

“i’m still not happy!”

但是在面对大规模需要翻译的句子时就会很慢,所以可以使用协程的方法。

这里我们使用了基于gevents库的grequests库。

仔细看了下googletrans库的核心代码,发现主要是构造一个url,然后发起get请求,得到一个json的结果,从中提取出翻译结果。

构造url的过程需要一个token,根据某些规则生成,所以为了方便还是调用googletrans的部分函数。

具体的参考代码如下:

这里是将德语(de)翻译成英语(en),代码中需要相应修改。

import grequests

import logging

import json

from googletrans import Translator

from googletrans.utils import format_json

headers = {‘User-Agent’:’Mozilla/5.0 (Windows NT 10.0; Win64; x64)’}

translator = Translator(service_urls=[‘translate.google.cn’])

logging.basicConfig(level = logging.INFO,format = ‘%(asctime)s – %(name)s – %(levelname)s – %(message)s’,filename=’log.txt’)

logger = logging.getLogger()

def exception_handler(request, exception):

logger.warning(‘exception when at %s :%s’,request.url,exception)

def work(urls):

reqs = (grequests.get(u,verify=True, allow_redirects=True, timeout=4) for u in urls)

res = grequests.map(reqs, exception_handler=exception_handler,size=20)

return res

def totaltranslate():

file2 = open(‘de2en_en.txt’,mode=’a’,encoding=’utf-8′)

with open(‘de.txt’,mode=’r’,encoding=’utf-8′) as f:

urls = []

num = 0

for line in f:

num+=1

line = line.strip()

token = translator.token_acquirer.do(line)

url=”https://translate.google.cn/translate_a/single?client=t&sl=de&tl=en&hl=en&dt=at&dt=bd&dt=ex&dt=ld&dt=md&dt=qca&dt=rw&dt=rm&dt=ss&dt=t&ie=UTF-8&oe=UTF-8&otf=1&ssel=3&tsel=0&kc=1&tk={0}&q={1}”.format(token,line)

urls.append(url)

if len(urls) >= 50:

res = work(urls)

for r in res:

if hasattr(r,’status_code’):

if r.status_code == 200:

try:

a=format_json(r.text)

target = ”.join([d[0] if d[0] else ” for d in a[0]])

source = ”.join([d[1] if d[1] else ” for d in a[0]])

except Exception as e:

logger.error(‘when format:%s’,e)

logger.error(‘%s\n%s’,r.text)

source = ”

target = ”

if len(source) != 0 and len(target) != 0:

file2.write(target+’\n’)

else:

file2.write(‘\n’)

else:

file2.write(‘\n’)

urls = []

logger.info(‘finish 50 sentence, now at %s’,num)

file2.close()

def sentencetranslate(line):

line = line.strip()

text = translator.translate(line,src=’de’,dest=’en’).text

return text

def completetranslate():

file1 = open(‘de2en_en.txt’,mode=’r’,encoding=’utf-8′)

file2 = open(‘new_de2en_en.txt’,mode=’a’,encoding=’utf-8′)

i = 1

with open(‘de.txt’,mode=’r’,encoding=’utf-8′) as f:

for line in f:

t = file1.readline()

if len(t) == 1:#’only \n’

text = sentencetranslate(line)

file2.write(text+’\n’)

else:

file2.write(t)

i += 1

if i%100 == 0:

print(i)

file1.close()

file2.close()

if __name__ == “__main__”:

totaltranslate()

completetranslate()

totaltranslate()以及翻译了大部分的句子,但是可能因为某些原因有一些句子没有翻译,所以还需要completetranslate()来补全翻译结果。

在grequests.map()中size设置为20的情况下,平均每秒翻译20句。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/201108.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • 视图索引总结

    视图索引总结一、视图的内部排序问在SQLServer里是不建议对视图进行排序的,下面是一位SQLServer专家的话:DontputORDERBYStatementsinViews.Delaysortinguntilyoureactuallyabouttousethedata.Ifyouendupsortingdiff

  • SSRF漏洞挖掘的思路与技巧

    SSRF漏洞挖掘的思路与技巧

  • 2021年程序人生的随想总结

    时光不负追梦人,愿你我不负韶华,前程似锦~~

  • 一篇文章搞定java中的垃圾回收机制面试题[通俗易懂]

    一篇文章搞定java中的垃圾回收机制面试题[通俗易懂]  一篇文章搞定java中的垃圾回收机制面试题任何语言在运行过程中都会创建对象,也就意味着需要在内存中为这些对象在内存中分配空间,在这些对象失去使用的意义的时候,需要释放掉这些内容,保证内存能够提供给新的对象使用。对于对象内存的释放就是垃圾回收机制,也叫做gc,对于java开发者来说gc是一个双刃剑我们这里找了两张搞笑图片分别来表示c语言的垃圾回收和java的垃圾回收。注意:并…

  • 收音机fm和am的区别是什么_FM收音机

    收音机fm和am的区别是什么_FM收音机1、频率区别FM=FrequencyModulation调频,微波;微波传输,信号质量高,传输成本低,发射功率小,覆盖范围小,受地理因素影响较大,一般作为城市广播的首选。比如你的家乡城市台,

  • Photoshop CC2019 快捷键壁纸 快捷键大全

    Photoshop CC2019 快捷键壁纸 快捷键大全篇幅较长,建议先收藏,以后有需要了随时可以查看一、工具箱(多种工具共用一个快捷键的可同时按【Shift】加此快捷键选取)矩形、椭圆选框工具【M】 移动工具【V】 套索、多边形套索、磁性套索【L】 魔棒工具【W】 裁剪工具【C】 切片工具、切片选择工具【K】 喷枪工具【J】 画笔工具、铅笔工具【B】 像皮图章、图案图章【S】 历史画笔工具、艺…

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号