大家好,又见面了,我是你们的朋友全栈君。
最近项目有一个用户地域分析的需求,现在知道ip字段,需要通过用户的ip查找归属地,我们这里将ip直接转换成对应城市的字符串。
一、通过IP库二分查找
ip库是从淘宝买的,csdn下载地址:【ip字段国内外均有】
- ip.txt是ip地址和归属地的规则数据,里面的数据是根据ip地址的十进制从高到低排序。
- 第一个字段是网段的起始IP地址,第二个字段是网段的结束IP地址,
- 第三个字段是网段的起始IP地址对应的十进制,第四个字段是网段的结束IP地址对应的十进制,
- 第五个字段代表洲,第六个代表国家,第七个代表省,第八个代表城市,其他字段可以忽略不计。
1.0.1.0|1.0.3.255|16777472|16778239|亚洲|中国|福建|福州||电信|350100|China|CN|119.306239|26.075302
1.0.8.0|1.0.15.255|16779264|16781311|亚洲|中国|广东|广州||电信|440100|China|CN|113.280637|23.125178
1.0.32.0|1.0.63.255|16785408|16793599|亚洲|中国|广东|广州||电信|440100|China|CN|113.280637|23.125178
1.1.0.0|1.1.0.255|16842752|16843007|亚洲|中国|福建|福州||电信|350100|China|CN|119.306239|26.075302
1.1.2.0|1.1.7.255|16843264|16844799|亚洲|中国|福建|福州||电信|350100|China|CN|119.306239|26.075302
1.1.8.0|1.1.63.255|16844800|16859135|亚洲|中国|广东|广州||电信|440100|China|CN|113.280637|23.125178
1.2.0.0|1.2.1.255|16908288|16908799|亚洲|中国|福建|福州||电信|350100|China|CN|119.306239|26.075302
1.2.2.0|1.2.2.255|16908800|16909055|亚洲|中国|北京|北京|海淀|北龙中网|110108|China|CN|116.29812|39.95931
1.2.4.0|1.2.4.7|16909312|16909319|亚洲|中国|北京|北京|海淀|中国互联网络信息中心|110108|China|CN|116.29812|39.95931
1.2.4.8|1.2.4.8|16909320|16909320|亚洲|中国|北京|北京|海淀|SDNS|110108|China|CN|116.29812|39.95931
1.2.4.9|1.2.4.255|16909321|16909567|亚洲|中国|北京|北京|海淀|中国互联网络信息中心|110108|China|CN|116.29812|39.95931
ip转化的方法
- Ip地址都是用十六进制表示的:
- 例如17.18.20.15 也就是11.12.14.0f
- 换算成十进制 15+20*256+18*256^2+17*256^3
- 使用二进制计算
实现代码:
public class IpBean {
private String startIp;
private String endIp;
private long startDecIp;
private long endDecIp;
private String province;
private String city;
private String optioner;
}
使用二分法查找 (工具类,很重要)
import java.io.BufferedReader;
import java.io.FileReader;
import java.util.ArrayList;
import java.util.List;
public class IpUtils {
//目的是减少读取文件的次数,
public static List<IpBean> ipBeanList =null;
static{
ipBeanList = getIpBeanList();
}
public static void main(String[] args) {
//System.out.println(strIpToLongIp("1.0.1.0"));
List<IpBean> ipBeanList = getIpBeanList();
System.out.println(ipBeanList.size());
}
/**
* 通过stringIp转换为长整型的ip
* @param str
* @return
*/
public static long strIpToLongIp(String str){
if(str==null){
return 0L;
}
long newIp = 0;
String[] split = str.split("\\.");
for(int i = 0;i<=3;i++){
long lL=Long.parseLong(split[i]);
newIp |=lL <<((3-i)<<3);
}
return newIp;
}
/**
* 获取存放ipBean的list集合
* @return
*/
public static List<IpBean> getIpBeanList(){
List<IpBean> list = new ArrayList<>();
try (BufferedReader br = new BufferedReader(new FileReader("../案例练习4/src/ch03/ip.txt"));){
String line = null;
//1.0.1.0|1.0.3.255|16777472|16778239|亚洲|中国|福建|福州||电信|350100|China|CN|119.306239|26.075302
while((line=br.readLine())!=null){
//System.out.println(line);
String[] split = line.split("\\|");
String startIp = split[0];
String endIp = split[1];
long startDecIp =Long.parseLong(split[2]);
long endDecIp = Long.parseLong(split[3]);
String province = split[6];
String city = split[7];
String optioner = split[9];
//System.out.println(optioner);
IpBean bean = new IpBean();
bean.set(startIp, endIp, startDecIp, endDecIp, province, city, optioner);
list.add(bean);
}
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return list;
}
/**
* 通过longIp从list里面获取相对应的IpBean
* @param longIp
* @return
*/
@Deprecated
public static IpBean getIpBeanByLongIp(long longIp) {
for (IpBean ipBean : ipBeanList) {
if(longIp>=ipBean.getStartDecIp()&&longIp<=ipBean.getEndDecIp()){
return ipBean;
}
}
return null;
}
/**
* 使用二分法通过ip找到对应的ipBean
* @param longIp
* @return
*/
public static IpBean getIpBeanByLongIpNew(long longIp){
int start = 0;
int end = ipBeanList.size()-1;
while(start<=end){
int middel = (start+end)/2;
IpBean ipBean = ipBeanList.get(middel);
//如果middel对应的ipBean是不是找的值
if(longIp>=ipBean.getStartDecIp()&&longIp<=ipBean.getEndDecIp()){
return ipBean;
}
//小于最小值的时候
if(longIp<ipBean.getStartDecIp()){
end = middel-1;
}
//大于最大值的时候
if(longIp>ipBean.getEndDecIp()){
start = middel+1;
}
}
return null;
}
}
二、通过第三方API定位
百度API通过ip定位:已被河蟹。
之前百度的定位是非常准的,官方成功率:综合定位成功率 65% ,精度:90% 误差 80m 以内;95% 误差 350m。
因为这种方法会泄露隐私,所以已经下架了。目前的api,定位只能是城市级别了。
三、总结
- 理论上来说,只要你的ip库足够强大,你也可以米级定位,百度是做地图的,所以很容易拿到这些信息。
- 我们作为程序员,关注里面的二分查找算法就可以了。
我的微信公众号:架构真经(id:gentoo666),分享Java干货,高并发编程,热门技术教程,微服务及分布式技术,架构设计,区块链技术,人工智能,大数据,Java面试题,以及前沿热门资讯等。每日更新哦!
参考资料:
- https://blog.csdn.net/qq392039757/article/details/78742251
- https://www.cnblogs.com/lichina/p/6079434.html
- https://blog.csdn.net/a331685690/article/details/80170830
发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/126771.html原文链接:https://javaforall.cn
【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛
【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...