亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

c#中XML解析文件出錯解決方法

 更新時間:2014年08月17日 10:03:45   投稿:mdxy-dxy  
在解析xml時,經(jīng)常因為文件中含特殊字符而解析失敗。原因有兩個:一是內(nèi)容中含有XML預定義好的實體,二是內(nèi)容中含有低位非打印字符

1.內(nèi)容中含有xml預定好的實體,如“<”和“&”,對xml來說是禁止使用的,針對這種字符,解決方式是使用CDATA部件以"<![CDATA[" 標記開始,以"]]>"標記結(jié)束,是CDATA內(nèi)部內(nèi)容被解析器忽略。具體說明參考《XML CDATA是什么?》。

2.內(nèi)容中含有低位非打印字符,解析時會報錯:""(十六進制值 0x1D)是無效的字符.加載或保存XML時引發(fā)的異常.System.ArgumentException: “”(十六進制值 0x1D)是無效的字符。

出錯的原因是內(nèi)容中含有低位非打印字符,處理方法是對其進行過濾,過濾方法為:

return System.Text.RegularExpressions.Regex.Replace(str,@"[\x00-\x08]|[\x0B-\x0C]|[\x0E-\x1F]";

以上兩種情況,第一種較為普遍,第二種遇到情況比較少,在面對一些用戶輸入數(shù)據(jù)時生成xml,可以對xml結(jié)點內(nèi)容執(zhí)行上述過濾,以保證xml文件使用者可以正確解析xml文檔。

以下是詳細解釋:

“”(十六進制值 0x1D)是無效的字符

加載或保存XML時引發(fā)的異常.System.ArgumentException: “”(十六進制值 0x1D)是無效的字符。
產(chǎn)生原因是xml文件中包含低位非打印字符造成的
處理方法:在產(chǎn)生xml文件的時候,過濾低位非打印字符

把一個字符串中的 低序位 ASCII 字符 替換成 &#x 字符
轉(zhuǎn)換 ASCII 0 - 8 -> &#x0 - &#x8
轉(zhuǎn)換 ASCII 11 - 12 -> &#xB - &#xC
轉(zhuǎn)換 ASCII 14 - 31 -> &#xE - &#x1F


簡單的處理方法
return System.Text.RegularExpressions.Regex.Replace(HttpUtility.HtmlEncode(str),@"[\x00-\x08]|[\x0B-\x0C]|[\x0E-\x1F]", "");

======================================================================================================================================================

復雜處理

獲取xml時,出現(xiàn)“(十六進制值 0x1F)是無效的字符之類Xml異常的解決辦法2008-12-19 10:44最近做新聞采集器,需要獲取很多站點的xml,加載個別站點經(jīng)常出現(xiàn)“(十六進制值 0x1F)是無效的字符”問題,百思不的其解。對于問題站點xml的處理,開始的思路是既然直接用 XmlDocument對象的Load()方法不行,就用LoadXML() ,用HttpWebRequest 獲取url讀到流里再轉(zhuǎn)為xml,中間可以加一些非有效字符的過濾處理,但仍然無效,僅僅解決了請求超時的問題...

問題擱置了1周后,終于在今天解決了。

其實很簡單,只加一條語句就搞定了

XmlDocument doc = new XmlDocument();

doc.Normalize();

         // 摘要:
        //     將此 XmlNode 下子樹完全深度中的所有 XmlText 節(jié)點都轉(zhuǎn)換成“正?!毙问?,在這種形式中只有標記(即標記、注釋、處理指令、CDATA
        //     節(jié)和實體引用)分隔 XmlText 節(jié)點,也就是說,沒有相鄰的 XmlText 節(jié)點。

以下是轉(zhuǎn)一位仁兄的貼:

最近碰到一個問題,我的一個把數(shù)據(jù)庫中記錄的信息暴露出來的Web Service調(diào)用時候出問題了。報下面的錯誤信息:

System.InvalidOperationException was unhandled
Message="XML 文檔(1, 823)中有錯誤。"
Source="System.Xml"
 Message="“”(十六進制值 0x0E)是無效的字符。 行 1,位置 823。"
 Source="System.Xml"

當這個錯誤發(fā)生時,Web Service 服務器端不會有任何錯誤,而調(diào)用這個 Web Service 的客戶端則會報上述錯誤。
是何原因?qū)е碌倪@個問題呢?
答案很簡單,是WEB Service 暴露的XML文檔中存在低序位非打印 ASCII 字符所致。
我們查看 Web Service 返回的XML 文檔文檔中,會有下面的XML文檔節(jié):其中的 就是低序位 ASCII 字符。 對應的字符如后:

<Value> 在神奇天地裏誰叱咤風雨</Value>

會導致這些問題的 低序位非打印 ASCII 字符包含以下字符:
#x0 - #x8 (ASCII 0 - 8)
#xB - #xC (ASCII 11 - 12)
#xE - #x1F (ASCII 14 - 31)

下面就是一個簡單演示這個問題的控制臺程序,
為了簡單起見,這里沒有建立 WebService, 而是把一個類XML序列化存儲到文件,然后再把這個文件反序列化讀取出來:
其中的這個類的Value值中,放了一個低序位非打印 ASCII 字符。
執(zhí)行這個控制臺程序,就會報異常?!癤ML 文檔(3, 12)中有錯誤?!?/p>

using System;
using System.Xml.Serialization;
using System.IO;
using System.Text;
using System.Globalization;
namespace TextSerialize
{
[Serializable]
public class MyClass
{
public string Value { get; set; }
}
class Program
{
static void Main(string[] args)
{
string fileName = "d:\\1.txt";
MyClass c = new MyClass();
c.Value = string.Format("在神奇{0}天地裏誰叱咤風雨", Convert.ToChar(14));
SaveAsXML(c, fileName, Encoding.UTF8);
object o = ConvertFileToObject(fileName, typeof(MyClass), Encoding.UTF8);
MyClass d = o as MyClass;
if (d != null) Console.WriteLine(d.Value);
else Console.WriteLine("null");
Console.ReadLine();
}
/// <summary>
/// 序列化
/// </summary>
/// <param name="objectToConvert"></param>
/// <param name="path"></param>
/// <param name="encoding"></param>
public static void SaveAsXML(object objectToConvert, string path, Encoding encoding)
{
if (objectToConvert != null)
{
Type t = objectToConvert.GetType();
XmlSerializer ser = new XmlSerializer(t);
using (StreamWriter writer = new StreamWriter(path, false, encoding))
{
ser.Serialize(writer, objectToConvert);
writer.Close();
}
}
}
/// <summary>
/// 反序列化
/// </summary>
/// <param name="path"></param>
/// <param name="objectType"></param>
/// <param name="encoding"></param>
/// <returns></returns>
public static object ConvertFileToObject(string path, Type objectType, Encoding encoding)
{
object convertedObject = null;
if (!string.IsNullOrEmpty(path))
{
XmlSerializer ser = new XmlSerializer(objectType);
using (StreamReader reader = new StreamReader(path, encoding))
{
convertedObject = ser.Deserialize(reader);
reader.Close();
}
}
return convertedObject;
}
}
}

上面提到的Web Service 的那個問題,跟這個演示程序是一樣的。

我們需要被序列化的內(nèi)容中,存在 低序位非打印 ASCII 字符 時, .net 會給我們正常序列化, 會自動把 低序位非打印 ASCII 字符 轉(zhuǎn)換成 &#x 編碼的字符(這個XML規(guī)范中要求這么做的)。

但是,反序列化時候,如果需要反序列化的內(nèi)容如果存在 &#x 編碼的字符(映射到低序位非打印 ASCII 字符),則反序列化就會出錯。


如果解決這個問題呢?

當然,最徹底的解決方法是修改反序列化的代碼,讓這些字符不會出錯。但這個東西很多時候不歸我們控制。這個方案不可行。

下一個方案就是剔除這些搗亂的字符。

我這里要給出的方案,是對這些字符序列化時作一次預處理,反序列化時,作一次反向處理。
這里為了演示的更有意義,我這里處理邏輯就是把 低序位非打印 ASCII 字符 轉(zhuǎn)換成 &#x 編碼的字符 ,和把&#x 編碼的字符 轉(zhuǎn)換成 低序位非打印 ASCII 字符。
這樣就可以使用我這里提供的函數(shù),實現(xiàn)更多的處理邏輯。這兩個函數(shù)的代碼如下:

       

/// <summary>
/// 把一個字符串中的 低序位 ASCII 字符 替換成 &#x 字符
/// 轉(zhuǎn)換 ASCII 0 - 8 -> &#x0 - &#x8
/// 轉(zhuǎn)換 ASCII 11 - 12 -> &#xB - &#xC
/// 轉(zhuǎn)換 ASCII 14 - 31 -> &#xE - &#x1F
/// </summary>
/// <param name="tmp"></param>
/// <returns></returns>
public static string ReplaceLowOrderASCIICharacters(string tmp)
{
StringBuilder info = new StringBuilder();
foreach (char cc in tmp)
{
int ss = (int)cc;
if (((ss >= 0) && (ss <= 8)) || ((ss >= 11) && (ss <= 12)) || ((ss >= 14) && (ss <= 32)))
info.AppendFormat("&#x{0:X};", ss);
else info.Append(cc);
}
return info.ToString();
}
/// <summary>
/// 把一個字符串中的下列字符替換成 低序位 ASCII 字符
/// 轉(zhuǎn)換 &#x0 - &#x8 -> ASCII 0 - 8
/// 轉(zhuǎn)換 &#xB - &#xC -> ASCII 11 - 12
/// 轉(zhuǎn)換 &#xE - &#x1F -> ASCII 14 - 31
/// </summary>
/// <param name="input"></param>
/// <returns></returns>
public static string GetLowOrderASCIICharacters(string input)
{
if (string.IsNullOrEmpty(input)) return string.Empty;
int pos, startIndex = 0, len = input.Length;
if (len <= 4) return input;
StringBuilder result = new StringBuilder();
while ((pos = input.IndexOf("&#x", startIndex)) >= 0)
{
bool needReplace = false;
string rOldV = string.Empty, rNewV = string.Empty;
int le = (len - pos < 6) ? len - pos : 6;
int p = input.IndexOf(";", pos, le);
if (p >= 0)
{
rOldV = input.Substring(pos, p - pos + 1);
// 計算 對應的低位字符
short ss;
if (short.TryParse(rOldV.Substring(3, p - pos - 3), NumberStyles.AllowHexSpecifier, null, out ss))
{
if (((ss >= 0) && (ss <= 8)) || ((ss >= 11) && (ss <= 12)) || ((ss >= 14) && (ss <= 32)))
{
needReplace = true;
rNewV = Convert.ToChar(ss).ToString();
}
}
pos = p + 1;
}
else pos += le;
string part = input.Substring(startIndex, pos - startIndex);
if (needReplace) result.Append(part.Replace(rOldV, rNewV));
else result.Append(part);
startIndex = pos;
}
result.Append(input.Substring(startIndex));
return result.ToString();
}


這樣,我們這個演示程序的 Main 函數(shù)修改為下面的代碼,也不會有任何錯誤發(fā)生。

 static void Main(string[] args)
{
Console.WriteLine(GetLowOrderASCIICharacters("123456&#x50000"));
Console.WriteLine(GetLowOrderASCIICharacters("123456&#x5"));
Console.WriteLine(GetLowOrderASCIICharacters("&#x5"));
Console.WriteLine(GetLowOrderASCIICharacters("0123 456789"));
Console.WriteLine(GetLowOrderASCIICharacters("\f"));
Console.WriteLine(GetLowOrderASCIICharacters(" =-1"));
Console.WriteLine(GetLowOrderASCIICharacters(" "));
Console.WriteLine(GetLowOrderASCIICharacters(" "));
string fileName = "d:\\1.txt";
MyClass c = new MyClass();
c.Value = string.Format("在神奇{0}天地裏誰叱咤風雨", Convert.ToChar(14));
c.Value = ReplaceLowOrderASCIICharacters(c.Value);
SaveAsXML(c, fileName, Encoding.UTF8);
object o = ConvertFileToObject(fileName, typeof(MyClass), Encoding.UTF8);
MyClass d = o as MyClass;
if (d != null)
{
d.Value = GetLowOrderASCIICharacters(d.Value);
Console.WriteLine(d.Value);
}
else Console.WriteLine("null");
Console.ReadLine();
}

相關文章

  • Unity實現(xiàn)簡單虛擬搖桿

    Unity實現(xiàn)簡單虛擬搖桿

    這篇文章主要為大家詳細介紹了Unity實現(xiàn)簡單虛擬搖桿,文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2020-04-04
  • C#使用CDO發(fā)送郵件的方法

    C#使用CDO發(fā)送郵件的方法

    這篇文章主要介紹了C#使用CDO發(fā)送郵件的方法,涉及C#使用Windows COM組件實現(xiàn)郵件發(fā)送的相關技巧,具有一定參考借鑒價值,需要的朋友可以參考下
    2015-07-07
  • C#實現(xiàn)單線程異步互斥鎖的示例代碼

    C#實現(xiàn)單線程異步互斥鎖的示例代碼

    異步互斥鎖的作用是用于確保存在異步操作的上下文同步互斥,這篇文章主要為大家詳細介紹了C#如何實現(xiàn)單線程異步互斥鎖,文中的示例代碼講解詳細,需要的可以參考下
    2024-01-01
  • WinForm實現(xiàn)程序一段時間不運行自動關閉的方法

    WinForm實現(xiàn)程序一段時間不運行自動關閉的方法

    這篇文章主要介紹了WinForm實現(xiàn)程序一段時間不運行自動關閉的方法,涉及WinForm計時器及進程操作的相關技巧,具有一定參考借鑒價值,需要的朋友可以參考下
    2015-09-09
  • C#面向?qū)ο筇卣鞯木唧w實現(xiàn)及作用詳解

    C#面向?qū)ο筇卣鞯木唧w實現(xiàn)及作用詳解

    所有的面相對象思想,歸根結(jié)底是為了簡化代碼,減少代碼量,構(gòu)建更符合現(xiàn)實生活邏輯的程序代碼,從而減輕程序員的負擔。不能一味地或者說刻意地去使用面相對象的思想而忽略了程序所實現(xiàn)的功能或者框架,要根據(jù)實際情況
    2013-10-10
  • C#事件管理器如何清空所有監(jiān)聽詳解

    C#事件管理器如何清空所有監(jiān)聽詳解

    這篇文章主要給大家介紹了關于C#事件管理器如何清空所有監(jiān)聽的相關資料,文中通過示例代碼以及圖文介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面來一起學習學習吧
    2020-07-07
  • C#三種方法獲取文件的Content-Type(MIME Type)

    C#三種方法獲取文件的Content-Type(MIME Type)

    這篇文章介紹了C#獲取文件Content-Type(MIME Type)的三種方法,文中通過示例代碼介紹的非常詳細。對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2022-01-01
  • 介紹C# 泛型類在使用中約束

    介紹C# 泛型類在使用中約束

    這篇文章介紹了C# 泛型類在使用中約束,有需要的朋友可以參考一下
    2013-09-09
  • 淺析.NET中AsyncLocal的實現(xiàn)原理

    淺析.NET中AsyncLocal的實現(xiàn)原理

    這篇文章主要為大家詳細介紹了.NET中AsyncLocal的具體實現(xiàn)原理,文中的示例代碼講解詳細,具有一定的借鑒價值,如果有講得不清晰或不準確的地方,還望指出
    2023-08-08
  • Unity實現(xiàn)移動端手勢解鎖功能

    Unity實現(xiàn)移動端手勢解鎖功能

    這篇文章主要為大家詳細介紹了Unity實現(xiàn)移動端手勢解鎖功能,文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2020-07-07

最新評論