Cómo saber si una cadena Bash contiene una subcadena en Linux

A veces, en los scripts de Linux, desea saber si una cadena de texto contiene una cadena específica más pequeña. Hay muchas maneras de hacer esto. Te mostramos algunas técnicas sencillas y fiables.
¿Por qué es útil?
Buscar una cadena para una subcadena más pequeña es un requisito común. Un ejemplo sería leer texto de un archivo o de una entrada humana y buscar en la cadena una subcadena específica para que su secuencia de comandos pueda decidir qué hacer a continuación. Podría estar buscando una etiqueta o nombre de dispositivo en un archivo de configuración o una cadena de comando en una línea de entrada de un usuario.
Los usuarios de Linux están bendecidos con una gran cantidad de utilidades para manipular texto. Algunos están integrados en el shell de Bash, otros se proporcionan como utilidades o aplicaciones independientes. Hay una razón por la cual los sistemas operativos derivados de Unix cuentan con abundantes capacidades de manipulación de cadenas.
Algunas cosas que parecen ser archivos no son archivos simples. Ellos son archivos especiales representando cosas como dispositivos de hardware y fuentes de información del sistema. La abstracción que realiza el sistema operativo les da la apariencia y características de archivos. Puede leer información de ellos, como texto, naturalmente, y en algunos casos escribir en ellos, pero no son archivos ordinarios.
El texto también se usa como entrada y salida para comandos en una ventana de terminal. Esto permite la redirección y canalización de entrada y salida. Esa funcionalidad respalda la capacidad de encadenar secuencias de comandos de Linux, pasando la salida de un comando como entrada al siguiente.
Independientemente de sus orígenes, buscar en el texto que recibimos una palabra, un comando, una etiqueta o algún otro indicador significativo es una parte estándar del manejo de datos basados en texto. Aquí hay una colección de técnicas simples que puede incluir en sus propios scripts.
Encontrar subcadenas con Bash Builtins
Los corchetes dobles"[[...]]
”La prueba de comparación de cadenas se puede utilizar en if
instrucciones para determinar si una cadena contiene otra cadena.
Copie este script en un editor y guárdelo en un archivo llamado "double.sh".
#!/bin/bash if [[ "monkey" = *"key"* ]]; then echo "key is in monkey" else echo "key is not in monkey" fi
Deberá hacer que el script sea ejecutable con el chmod
dominio. Este es un paso que siempre se requiere para hacer que cualquier script sea ejecutable. Deberá hacer esto cada vez que cree un archivo de secuencia de comandos. Sustituya el nombre del script apropiado en cada caso.
chmod +x double.sh
Ejecutemos el script.
./double.sh
Esto funciona porque el asterisco " *
”Representa cualquier secuencia de caracteres, incluso sin caracteres. Si la "clave" de la subcadena se encuentra dentro de la cadena de destino, con o sin caracteres delante o detrás, la prueba devolverá verdadero.
En nuestro ejemplo, hay caracteres delante de la subcadena. Estos se corresponden con el primer asterisco. No hay letras detrás de la subcadena pero, debido a que un asterisco tampoco coincide con ningún carácter, la prueba aún pasa.
Para mayor flexibilidad, podemos modificar nuestro script para manejar variables en lugar de cadenas literales. Este es el script "double2.sh".
#!/bin/bash string="Monkey" substring="key" if [[ $string = *$substring* ]]; then echo "$substring was found in $string" else echo "$substring was not found in $string" fi
Veamos cómo funciona eso.
./double2.sh
Esto funciona de la misma manera, con la ventaja de que podemos usar nombres de variables en lugar de cadenas literales. Convertir nuestra pequeña solución en una función proporcionará la mayor flexibilidad.
Este es el script "double3.sh".
#!/bin/bash shopt -s nocasematch string="Monkey" substring="Key" capital="London" check_substring () { if [[ $1 = *$2* ]]; then echo "$2 was found in $1" else echo "$2 was not found in $1" fi } check_substring "Monkey" "key" check_substring $string $substring check_substring $string "banana" check_substring "Wales" $capital
llamamos a nuestro check_substring
función utilizando una combinación de variables y cadenas literales. Nosotros usamos shopt
con su -s
(establecer) opción para configurar nocasematch
para que las coincidencias no distingan entre mayúsculas y minúsculas.
Así es como funciona.
./double3.sh
Podemos usar el truco de envolver la subcadena en asteriscos en case
declaraciones, también. Esto es "caso.sh".
#!/bin/bash shopt -s nocasematch string="Wallaby" substring="Wall" case $string in *$substring*) echo "$substring was found in $string" ;; *) echo "Nothing matched: $string" ;; esac
Usando case
declaraciones en lugar de muy largas if
Las declaraciones pueden hacer que los scripts sean más fáciles de leer y depurar. Si necesitaba verificar si una cadena contenía una de muchas subcadenas posibles, el case
declaración sería la mejor opción.
./case.sh
Se encuentra la subcadena.
Encontrar subcadenas con grep
Más allá de las funciones integradas de Bash, la primera herramienta de búsqueda de texto que probablemente encontrará es grep
. Nosotros podemos usar grep
La capacidad innata de buscar una cadena dentro de una cadena para buscar nuestras subcadenas.
Este script se llama "subgrep.sh".
#!/bin/bash string="porridge pot" substring="ridge" if $(echo $string | grep -q $substring); then echo "$substring was found in $string" else echo "$substring was not found in $string" fi
El guión utiliza echo
para enviar la cadena a grep
, que busca la subcadena. estamos usando el -q
opción (silencioso) para detener grep
escribiendo cualquier cosa en la salida estándar.
Si el resultado de los comandos entre paréntesis "(...)
"Es igual a cero, significa que se encontró una coincidencia. porque cero es igual a true
en bash, el if
se cumple el enunciado y el then
se ejecuta la cláusula.
Veamos cuál es su salida.
./subgrep.sh
Encontrar subcadenas con sed
Nosotros podemos usar sed
para encontrar una subcadena, también.
Por defecto, sed
imprime todo el texto que se introduce en él. Usando sed -n
previene esto. Las únicas líneas que se imprimen son las líneas coincidentes. Esta expresión imprimirá cualquier línea que coincida o contenga el valor de $ subcadena.
"/$substring/p"
Alimentamos el valor de $string
dentro sed
usando una redirección aquí, <<<
. Esto se usa para redirigir valores a un comando en el shell actual. No invoca una subcapa como lo haría una canalización.
El primero -n
es la prueba. regresará true
si la salida del sed
comando es distinto de cero. La única forma en que la salida de sed
puede ser distinto de cero si se encontró una línea coincidente. Si ese es el caso, $substring
debe haber sido encontrado en $string
.
Esto es "subsed.sh".
#!/bin/bash string="Sweden" substring="eden" if [ -n "$(sed -n "/$substring/p" <<< $string)" ]; then echo "$substring was found in $string" else echo "$substring was not found in $string" fi
Obtenemos la respuesta esperada cuando ejecutamos el script.
./subsed.sh
Podemos probar la lógica del script editando el valor de $substring
para que la comparación falle.
./suscrito.sh
Deja de buscar, lo encontré
Otras herramientas pueden encontrar subcadenas, como awk
y Perl
pero un caso de uso simple como encontrar una subcadena no garantiza su funcionalidad adicional ni la complejidad adicional. En particular, usar las funciones integradas de Bash para buscar subcadenas es rápido, simple y no requiere herramientas externas.
RELACIONADO: Cómo usar declaraciones de casos en scripts Bash