要使用正則表達式識別URL中的域名,您可以使用以下模式:
(?:http|https|ftp):\/\/(?:(?:[A-Z0-9](?:[A-Z0-9-]{0,61}[A-Z0-9])?\.)+(?:[A-Z]{2,6}\.?|[A-Z0-9-]{2,}\.?)|'(?:localhost|'[\w-]+\.)*\w[\w-]{0,61}\.\w{2,6})
這個正則表達式考慮了各種URL格式,包括協議(http、https、ftp)、子域名、主域名和頂級域名。下面是一個Python示例,演示如何使用這個正則表達式來提取URL中的域名:
import re
url = "https://www.example.com/path/to/page?query=parameter#anchor"
pattern = r'(?:http|https|ftp):\/\/(?:(?:[A-Z0-9](?:[A-Z0-9-]{0,61}[A-Z0-9])?\.)+(?:[A-Z]{2,6}\.?|[A-Z0-9-]{2,}\.?)|'(?:localhost|'[\w-]+\.)*\w[\w-]{0,61}\.\w{2,6})'
domain = re.search(pattern, url)
if domain:
print("域名:", domain.group())
else:
print("未找到域名")
運行此代碼將輸出:
域名: www.example.com
請注意,這個正則表達式可能無法涵蓋所有可能的URL情況。您可以根據需要對其進行調整。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。