net 用正则表达式获取网页内指a标签中的title

.Net技术 码拜 4年前 (2016-02-26) 203次浏览
这是本人写的,但是操作太复杂,有没有更简单直接的做法
/// <summary>
/// 获取网页a标签中title
/// </summary>
/// <param name=”args”></param>
static void Main(string[] args)
{
string resultHtml = getHtml(“http://bbs.csdn.net/topics/391047173”);
//获取a标签中href
//string regexHref = @”(?is)<a((?!href=)[\s\S])*href=[“””]?(?<href>[^”””]*)[^<]*</a>”;
//获取a标签中title
string regexHrefTitleInA2 = @”(?is)<a[^>]+?title=([“””]?)(?<title>[^”””\s>]+)\1[^>]*>(?<text>(?:(?!</?a\b).)*)</a>”;
var matches = Regex.Matches(resultHtml, regexHrefTitleInA2);
foreach (Match item in matches)
{
if (item.Success)
{
Console.WriteLine(item.Groups[“title”].Value);
}
Console.WriteLine();
}
Console.Read();
}
/// <summary>
/// 获取指定网址内容
/// </summary>
/// <param name=”url”>网址</param>
/// <returns>网页内容字符串</returns>
private static string getHtml(string url)
{
HttpWebRequest request = (HttpWebRequest)WebRequest.Create(url);
HttpWebResponse response = (HttpWebResponse)request.GetResponse();
Stream stream = response.GetResponseStream();
StreamReader sr = new StreamReader(stream,Encoding.GetEncoding(response.CharacterSet));
string html = sr.ReadToEnd();
sr.Close();
return html;
}
解决方案

5

15

@"<a[^>]*?title=("|"")(?<title>.*?)\1"

CodeBye 版权所有丨如未注明 , 均为原创丨本网站采用BY-NC-SA协议进行授权 , 转载请注明net 用正则表达式获取网页内指a标签中的title
喜欢 (0)
[1034331897@qq.com]
分享 (0)