大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。
Jetbrains全家桶1年46,售后保障稳定
有的时候,使用C++进行爬虫操作时,会涉及到一些请求参数的加密,例如对utf8的中文进行加密,我们用js对如下字符串进行加密的结果如下:
加密前字符串:keras-lx-还魂草.z01
URL加密后:keras-lx-%E8%BF%98%E9%AD%82%E8%8D%89.z01
使用网页在线加密工具和使用js加密效果是一样的
自己用C++写的URL加密代码如下:
// URL编码.cpp : 定义控制台应用程序的入口点。
//
#include<iostream>
#include<stdio.h>
#include<windows.h>
#include<string>
#include<regex>
using namespace std;
string UrlUTF8(char * str);
void GB2312ToUTF_8(string& pOut, char *pText, int pLen);
void Gb2312ToUnicode(WCHAR* pOut, char *gbBuffer);
void UnicodeToUTF_8(char* pOut, WCHAR* pText);
string utf8_uri(string filename);
string UrlUTF8(char * str)
{
string tt;
string dd;
GB2312ToUTF_8(tt, str, strlen(str));
int len = tt.length();
for (int i = 0; i<len; i++)
{
if (isalnum((BYTE)tt.at(i))) //判断字符中是否有数组或者英文
{
char tempbuff[2] = {
0 };
sprintf_s(tempbuff, "%c", (BYTE)tt.at(i));
dd.append(tempbuff);
}
else if (isspace((BYTE)tt.at(i)))
{
dd.append("+");
}
else
{
char tempbuff[4];
sprintf_s(tempbuff, "%%%X%X", ((BYTE)tt.at(i)) >> 4, ((BYTE)tt.at(i)) % 16);
dd.append(tempbuff);
}
}
return dd;
}
void GB2312ToUTF_8(string& pOut, char *pText, int pLen)
{
char buf[4];
memset(buf, 0, 4);
pOut.clear();
int i = 0;
while (i < pLen)
{
//如果是英文直接复制就可以
if (pText[i] >= 0)
{
char asciistr[2] = {
0 };
asciistr[0] = (pText[i++]);
pOut.append(asciistr);
}
else
{
WCHAR pbuffer;
Gb2312ToUnicode(&pbuffer, pText + i);
UnicodeToUTF_8(buf, &pbuffer);
pOut.append(buf);
i += 2;
}
}
return;
}
void Gb2312ToUnicode(WCHAR* pOut, char *gbBuffer)
{
::MultiByteToWideChar(CP_ACP, MB_PRECOMPOSED, gbBuffer, 2, pOut, 1);
return;
}
void UTF_8ToUnicode(WCHAR* pOut, char *pText)
{
char* uchar = (char *)pOut;
uchar[1] = ((pText[0] & 0x0F) << 4) + ((pText[1] >> 2) & 0x0F);
uchar[0] = ((pText[1] & 0x03) << 6) + (pText[2] & 0x3F);
return;
}
void UnicodeToUTF_8(char* pOut, WCHAR* pText)
{
// 注意 WCHAR高低字的顺序,低字节在前,高字节在后
char* pchar = (char *)pText;
pOut[0] = (0xE0 | ((pchar[1] & 0xF0) >> 4));
pOut[1] = (0x80 | ((pchar[1] & 0x0F) << 2)) + ((pchar[0] & 0xC0) >> 6);
pOut[2] = (0x80 | (pchar[0] & 0x3F));
return;
}
string utf8_uri(string filename)
{
//这种方法可以转换带中文的string为char*
const char* p_file = filename.c_str();
char* pc = new char[1024];//足够长
strcpy(pc, p_file);
string utf8Code = "";
utf8Code = UrlUTF8(pc);
pc = NULL;
delete[] pc;
//其中某些标点符号也被转了,这里需要复原
//下面用正则表达式将某些不需要转换的标点符号还原过来
//例如-和.
regex r1("%2D");
utf8Code = regex_replace(utf8Code, r1, "-");
r1=("%2E");
utf8Code = regex_replace(utf8Code, r1, ".");
return utf8Code;
}
int main()
{
string filename = "keras-lx-还魂草.z01";
cout << utf8_uri(filename) << endl;
getchar();
return 0;
}
**注意在utf8_uri这个函数中,下面的这些代码是将某些转过去的字符复原回来,因为按照js的URL加密方法,某些标点符号是不需要转换的,例如-和.,因此如果你使用我这个函数时,根据自己的情况加上把某些字符复原的代码
//其中某些标点符号也被转了,这里需要复原
//下面用正则表达式将某些不需要转换的标点符号还原过来
//例如-和.
regex r1("%2D");
utf8Code = regex_replace(utf8Code, r1, "-");
r1=("%2E");
utf8Code = regex_replace(utf8Code, r1, ".");
return utf8Code;
**
我们运行这个程序,得到如下运行结果
keras-lx-%E8%BF%98%E9%AD%82%E8%8D%89.z01
这个生成结果与使用js的encodeURIComponent函数对字符串进行URL转换得到的结果完全一样。
发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/219227.html原文链接:https://javaforall.cn
【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛
【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...