Cómo saber si una cadena Bash contiene una subcadena en Linux

fatmawati achmad zaenuri / Shutterstock.com

A veces, en los scripts de Linux, desea saber si una cadena de texto contiene una cadena específica más pequeña. Hay muchas maneras de hacer esto. Te mostramos algunas técnicas sencillas y fiables.

→ Índice de contenidos

¿Por qué es útil?

Buscar una cadena para una subcadena más pequeña es un requisito común. Un ejemplo sería leer texto de un archivo o de una entrada humana y buscar en la cadena una subcadena específica para que su secuencia de comandos pueda decidir qué hacer a continuación. Podría estar buscando una etiqueta o nombre de dispositivo en un archivo de configuración o una cadena de comando en una línea de entrada de un usuario.

Los usuarios de Linux están bendecidos con una gran cantidad de utilidades para manipular texto. Algunos están integrados en el shell de Bash, otros se proporcionan como utilidades o aplicaciones independientes. Hay una razón por la cual los sistemas operativos derivados de Unix cuentan con abundantes capacidades de manipulación de cadenas.

Algunas cosas que parecen ser archivos no son archivos simples. Ellos son archivos especiales representando cosas como dispositivos de hardware y fuentes de información del sistema. La abstracción que realiza el sistema operativo les da la apariencia y características de archivos. Puede leer información de ellos, como texto, naturalmente, y en algunos casos escribir en ellos, pero no son archivos ordinarios.

El texto también se usa como entrada y salida para comandos en una ventana de terminal. Esto permite la redirección y canalización de entrada y salida. Esa funcionalidad respalda la capacidad de encadenar secuencias de comandos de Linux, pasando la salida de un comando como entrada al siguiente.

Independientemente de sus orígenes, buscar en el texto que recibimos una palabra, un comando, una etiqueta o algún otro indicador significativo es una parte estándar del manejo de datos basados ​​en texto. Aquí hay una colección de técnicas simples que puede incluir en sus propios scripts.

Encontrar subcadenas con Bash Builtins

Los corchetes dobles"[[...]]”La prueba de comparación de cadenas se puede utilizar en if instrucciones para determinar si una cadena contiene otra cadena.

Copie este script en un editor y guárdelo en un archivo llamado "double.sh".

#!/bin/bash

if [[ "monkey" = *"key"* ]]; then
  echo "key is in monkey"
else
  echo "key is not in monkey"
fi

Deberá hacer que el script sea ejecutable con el chmod dominio. Este es un paso que siempre se requiere para hacer que cualquier script sea ejecutable. Deberá hacer esto cada vez que cree un archivo de secuencia de comandos. Sustituya el nombre del script apropiado en cada caso.

chmod +x double.sh

hacer un script ejecutable con chmod

Ejecutemos el script.

./double.sh

Ejecutando el script double.sh

Esto funciona porque el asterisco " * ”Representa cualquier secuencia de caracteres, incluso sin caracteres. Si la "clave" de la subcadena se encuentra dentro de la cadena de destino, con o sin caracteres delante o detrás, la prueba devolverá verdadero.

En nuestro ejemplo, hay caracteres delante de la subcadena. Estos se corresponden con el primer asterisco. No hay letras detrás de la subcadena pero, debido a que un asterisco tampoco coincide con ningún carácter, la prueba aún pasa.

Para mayor flexibilidad, podemos modificar nuestro script para manejar variables en lugar de cadenas literales. Este es el script "double2.sh".

#!/bin/bash

string="Monkey"
substring="key"

if [[ $string = *$substring* ]]; then
  echo "$substring was found in $string"
else
  echo "$substring was not found in $string"
fi

Veamos cómo funciona eso.

./double2.sh

Ejecutando el script double2.sh

Esto funciona de la misma manera, con la ventaja de que podemos usar nombres de variables en lugar de cadenas literales. Convertir nuestra pequeña solución en una función proporcionará la mayor flexibilidad.

Este es el script "double3.sh".

#!/bin/bash

shopt -s nocasematch

string="Monkey"
substring="Key"
capital="London"

check_substring ()
{
if [[ $1 = *$2* ]]; then
  echo "$2 was found in $1"
else
  echo "$2 was not found in $1"
fi
}

check_substring "Monkey" "key" 
check_substring $string $substring
check_substring $string "banana"
check_substring "Wales" $capital

llamamos a nuestro check_substring función utilizando una combinación de variables y cadenas literales. Nosotros usamos shopt con su -s (establecer) opción para configurar nocasematchpara que las coincidencias no distingan entre mayúsculas y minúsculas.

Así es como funciona.

./double3.sh

Ejecutando el script double3.sh

Podemos usar el truco de envolver la subcadena en asteriscos en case declaraciones, también. Esto es "caso.sh".

#!/bin/bash

shopt -s nocasematch

string="Wallaby"
substring="Wall"

case $string in

  *$substring*)
    echo "$substring was found in $string"
    ;;

  *)
    echo "Nothing matched: $string"
    ;;
esac

Usando case declaraciones en lugar de muy largas if Las declaraciones pueden hacer que los scripts sean más fáciles de leer y depurar. Si necesitaba verificar si una cadena contenía una de muchas subcadenas posibles, el case declaración sería la mejor opción.

./case.sh

Ejecutando el script case.sh

Se encuentra la subcadena.

Encontrar subcadenas con grep

Más allá de las funciones integradas de Bash, la primera herramienta de búsqueda de texto que probablemente encontrará es grep. Nosotros podemos usar grepLa capacidad innata de buscar una cadena dentro de una cadena para buscar nuestras subcadenas.

Este script se llama "subgrep.sh".

#!/bin/bash

string="porridge pot"
substring="ridge"

if $(echo $string | grep -q $substring); then
  echo "$substring was found in $string"
else
  echo "$substring was not found in $string"
fi

El guión utiliza echo para enviar la cadena a grep, que busca la subcadena. estamos usando el -q opción (silencioso) para detener grep escribiendo cualquier cosa en la salida estándar.

Si el resultado de los comandos entre paréntesis "(...)"Es igual a cero, significa que se encontró una coincidencia. porque cero es igual a true en bash, el if se cumple el enunciado y el then se ejecuta la cláusula.

Veamos cuál es su salida.

./subgrep.sh

Ejecutando el script subgrep.sh

Encontrar subcadenas con sed

Nosotros podemos usar sed para encontrar una subcadena, también.


Por defecto, sed imprime todo el texto que se introduce en él. Usando sed -n previene esto. Las únicas líneas que se imprimen son las líneas coincidentes. Esta expresión imprimirá cualquier línea que coincida o contenga el valor de $ subcadena.

"/$substring/p"

Alimentamos el valor de $string dentro sed usando una redirección aquí, <<<. Esto se usa para redirigir valores a un comando en el shell actual. No invoca una subcapa como lo haría una canalización.

El primero -n es la prueba. regresará true si la salida del sed comando es distinto de cero. La única forma en que la salida de sed puede ser distinto de cero si se encontró una línea coincidente. Si ese es el caso, $substring debe haber sido encontrado en $string.

Esto es "subsed.sh".

#!/bin/bash

string="Sweden"
substring="eden"

if [ -n "$(sed -n "/$substring/p" <<< $string)" ]; then
  echo "$substring was found in $string"
else
  echo "$substring was not found in $string"
fi

Obtenemos la respuesta esperada cuando ejecutamos el script.

./subsed.sh

Ejecutando el script subsed.sh

Podemos probar la lógica del script editando el valor de $substring para que la comparación falle.

./suscrito.sh

Ejecutar el script subsed.sh con una subcadena no coincidente

Deja de buscar, lo encontré

Otras herramientas pueden encontrar subcadenas, como awk y Perl pero un caso de uso simple como encontrar una subcadena no garantiza su funcionalidad adicional ni la complejidad adicional. En particular, usar las funciones integradas de Bash para buscar subcadenas es rápido, simple y no requiere herramientas externas.

RELACIONADO: Cómo usar declaraciones de casos en scripts Bash

Subir Change privacy settings