相关疑难解决方法(0)

如何从URL中提取顶级域名(TLD)

如何从URL中提取域名,不包括任何子域名?

我最初的简单尝试是:

'.'.join(urlparse.urlparse(url).netloc.split('.')[-2:])
Run Code Online (Sandbox Code Playgroud)

这适用于http://www.foo.com,但不适用于http://www.foo.com.au.有没有办法在不使用有关有效TLD(顶级域名)或国家/地区代码(因为它们发生变化)的特殊知识的情况下正确执行此操作.

谢谢

python dns url parsing extract

49
推荐指数
4
解决办法
6万
查看次数

PHP从子域获取域名

我需要编写一个函数来解析包含域名的变量.我最好用一个例子来解释这个,变量可以包含以下任何一个:

here.example.com
example.com
example.org
here.example.org
Run Code Online (Sandbox Code Playgroud)

但是当通过我的函数时,所有这些必须返回example.com或example.co.uk,基本上是域名.我确定我以前做过这个,但我一直在谷歌搜索大约20分钟,但找不到任何东西.任何帮助,将不胜感激.

编辑:忽略.co.uk,假设通过此功能的所有域都有3个字母的TLD.

php subdomain dns

26
推荐指数
5
解决办法
4万
查看次数

如何使用Regex&Php验证域名?

我想要一个解决方案只验证域名不是完整的URL,以下示例是我正在寻找的:

domain.com -> true
domain.net -> true
domain.org -> true
domain.biz -> true
domain.co.uk -> true
sub.domain.com -> true
domain.com/folder -> false
domµ*$ain.com -> false
Run Code Online (Sandbox Code Playgroud)

谢谢

php regex preg-match

18
推荐指数
2
解决办法
3万
查看次数

从字符串URL获取域名和页面名称

好吧,我目前有一些关于操纵URL的问题.

从技术上讲,我想要的是从页面获取域名和页面名称.

例如 :

www.myWebSite.com => domain : myWebSite
http://myWebSite.com => domain : myWebSite
myWebSite.com/xxx.hmtl => domain : myWebSite page : xxx
Run Code Online (Sandbox Code Playgroud)

javascript regex jquery

16
推荐指数
3
解决办法
4万
查看次数

找到http://和/或www.并从域中剥离.离开domain.com

我对python很新.我正在尝试解析URL文件,只留下域名.

我的日志文件中的一些网址以http://开头,有些网址以www.Some开头.

这是我的代码中删除http://部分的部分.我需要添加什么来查找http和www.并删除两个?

line = re.findall(r'(https?://\S+)', line)
Run Code Online (Sandbox Code Playgroud)

目前,当我运行代码时,只有http://被剥离.如果我将代码更改为以下内容:

line = re.findall(r'(https?://www.\S+)', line)
Run Code Online (Sandbox Code Playgroud)

只有以两者开头的域都会受到影响.我需要代码更有条件.TIA

编辑...这是我的完整代码......

import re
import sys
from urlparse import urlparse

f = open(sys.argv[1], "r")

for line in f.readlines():
 line = re.findall(r'(https?://\S+)', line)
 if line:
  parsed=urlparse(line[0])
  print parsed.hostname
f.close()
Run Code Online (Sandbox Code Playgroud)

我把原帖误认为正则表达式.它确实使用urlparse.

python url urlparse

12
推荐指数
3
解决办法
2万
查看次数

使用正则表达式获取URL的域

我正在尝试获取给定URL的域名.例如http://www.facebook.com/someuser/将返回facebook.com.给定的URL可以采用以下格式:

  1. https://www.facebook.com/someuser (www.是可选的,但应该被忽略)
  2. www.facebook.com/someuser (http://不是必需的)
  3. facebook.com/someuser
  4. http://someuser.tumblr.com- >这tumblr.com只能返回

我写了这个正则表达式:

/(?: \.|\/{2})(?: www\.)?([^\/]*)/i

但它没有像我期望的那样起作用.

我可以部分地做到这一点:

  1. 删除http://https://,如果存在的字符串,string.delete "/https?:\/\//i".
  2. 删除www.string.delete "/www\./i".
  3. 获取匹配的域名 /(\w+\.\w+)+/i

但这不适用于子域.测试字符串:

https://www.facebook.com/username
http://last.fm/user/username
www.google.com
facebook.com/username
http://sub.tumblr.com/
sub.tumblr.com
Run Code Online (Sandbox Code Playgroud)

我需要这个以尽可能少的内存和处理海岸.

有任何想法吗?

ruby regex string url parsing

6
推荐指数
1
解决办法
6108
查看次数

使用java实现Public Suffix提取

我需要提取网址的顶级域名,我得到了他的 http://publicsuffix.org/index.html

并且java实现在http://guava-libraries.googlecode.com,我找不到任何提取域名的例子

say example..
example.google.com
returns google.com

and bing.bing.bing.com
returns bing.com
Run Code Online (Sandbox Code Playgroud)

任何人都可以告诉我如何使用这个库实现一个例子....

java domain-name tld guava

5
推荐指数
1
解决办法
5210
查看次数

从url Python中提取域名

我想从网址列表中提取域名.就像从网址提取域名一样
我的问题是网址可以是关于所有内容的,很少有例子:
m.google.com=> google
m.docs.google.com=> google
www.someisotericdomain.innersite.mall.co.uk=> mall
www.ouruniversity.department.mit.ac.us=> mit
www.somestrangeurl.shops.relevantdomain.net=> relevantdomain
www.example.info=> example
依此类推.
域名的多样性不允许我使用正则表达式,如如何从URL获取域名(因为我的脚本将在实时网络流量上运行,正则表达式必须是巨大的,以便捕获所提到的各种域).
不幸的是我的网络研究没有提供任何有效的解决方案.
有没有人知道如何做到这一点?
任何帮助将不胜感激 !
谢谢

python regex url packages server

5
推荐指数
2
解决办法
6827
查看次数

如何在 JavaScript 中获取域名的“有意义”节点?

我所说的“有意义”是指大多数人用来识别网站的 URL 部分(有专门的技术术语吗?)。例如,我希望代码在以下所有情况下返回“gm”:

gm.com, gm.net, gm.info, gm.com.uk, gm.co.jp, gm.jp(这些可能不是真实的网站)

另外,当上述任何一个具有附加子域时,例如www.gm.comwww.cars.gm.com等。它不必与国际化国家/地区代码顶级域(具有非 ASCII 字符的域)一起使用。

我能想到的唯一方法是将最高级别的标签(例如.com)与通用顶级域、美国顶级域和国家/地区代码顶级域进行比较,然后尝试在某一位置向左移一个标签。时间。尽管如此,这仍然需要我知道(以及所有其他国家/地区)下的所有二级域名.jp,因为否则我将无法为 和 返回正确的www.yahoo.jpyahoo.co.jp。有一个更好的方法吗?

javascript url

4
推荐指数
1
解决办法
572
查看次数

获取 UIWebview 的当前域

我想获取UIWebView的当前域

例如:

http://amtmall.com/i15104234454.htm?sid=a0c935526ab19ee7051225579c90cf96&spm=875.124399.275145.1 -> tmall.com

有什么可靠的方法可以做到这一点吗?

我看到有人提出这样的建议:

 NSString *currentURL = myWebView.request.URL.absoluteString;
Run Code Online (Sandbox Code Playgroud)

我知道正则表达式可以做到这一点。还有其他办法吗?

regex uiwebview nsstring ios

1
推荐指数
1
解决办法
2409
查看次数

如何使用php获取URL主机

如果我有以下网址,我想获取任何网址的主机名

$url = "http://www.google.com";
Run Code Online (Sandbox Code Playgroud)

那么我想只得到google点后面.和扩展点之前的内容,.以便它可以应用于所有类型的网址.

所以结果应该是google!我认为这可能需要正则表达式或以某种方式任何想法如何做,谢谢.

php regex url

1
推荐指数
1
解决办法
3861
查看次数