¿Qué es “= C2 = A0” en MIME codificado, texto citado imprimible?
-
03-10-2019 - |
Pregunta
Este es un ejemplo de correo electrónico prima que estoy tratando de analizar:
MIME-version: 1.0
Content-type: text/html; charset=UTF-8
Content-transfer-encoding: quoted-printable
X-Mailer: Verizon Webmail
X-Originating-IP: [x.x.x.x]
=C2=A0test testing testing 123
¿Cuál es = C2 = A0? He tratado de una media docena de programas de análisis citado imprimibles, pero ninguno mango esto correctamente. ¿Cómo se podría analizar adecuadamente esto en C #?
Sinceramente, por ahora, estoy de codificación:
//TODO WTF
encoded = encoded.Replace("=C2=A0", "");
Debido a que no puedo entender por qué ese texto no es al azar dentro del contenido MIME, y no se supone que debe ser dictada en cualquier cosa. Por sólo la eliminación de ella, me estoy haciendo el efecto deseado - pero ¿por qué
?!Para ser claros, sé que (= [0-9A-F] {2}) es un carácter codificado. Pero en este caso, que aparentemente no representa nada.
Solución
"= C2 = A0" representa los bytes C2 A0. Sin embargo, ya que este es UTF-8, que se traduce en 00A0, que es el Unicode para el espacio de no separación.
Consulte UTF-8 (Wikipedia).