Eruano's Blog

Simple y con foco… como debe ser!

VB – Obtener Texto Contenido dentro de HTML

with one comment

Teniendo contenido Html en una variable tipo string debi “limpitar” dicho contenido para obtener solamente el texto dentro de las etiquetas, para ello use:

Private Function ObtenerTextoDesdeHtml(ByVal TextoHTML As String) As String
   ' Se reemplazan los saltos de linea en html por
   ' salto de linea en texto
   TextoHTML = TextoHTML.Replace("<br>", _
   System.Environment.NewLine)
   TextoHTML = TextoHTML.Replace("</br>", _
   System.Environment.NewLine)
   ' Se eliminan todas las etiquetas html de la
   ' variable TextoHTML
   TextoHTML = System.Text.RegularExpressions.Regex.Replace( _
   TextoHTML, "<(.|\n)*?>", String.Empty)
   Return TextoHTML
End Function
Private Sub Main()
   Dim strConHtml as String = "<a>Este texto</a>
   <b>debe quedar limpio y en en dos lineas</b>"
   Dim strSinHtml as String
   strSinHtml = ObtenerTextoDesdeHtml(strConHtml)
   System.Windows.Forms.MessageBox.Show(strConHtml)
   System.Windows.Forms.MessageBox.Show(strSinHtml)
End Sub

Ojala sea de ayuda. Saludos

Written by eruano

4 abril 2011 a 3:52 pm

Una respuesta

Subscribe to comments with RSS.

  1. Excelente función.
    Gracias!!!

    C#ristian

    30 diciembre 2011 at 3:28 pm


Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: