jueves, 25 de octubre de 2012

Biología (real e imaginaria) del número e

Siempre me fascinaron los números que se ocultan tras un seudónimo, números cuyo largo o extraño "nombre numérico" apenas podemos pronunciar y nos vemos obligados a renombrarlos con identificadores más próximos a nuestro lenguaje habitual. O bien, números que son tan importantes que los distinguimos con una denominación alternativa. Entre los más famosos tenemos, por supuesto, a π, acompañado del número e y de la unidad imaginaria i

Aún recuerdo mi asombro, y mi deleite, al descubrir que estos tres podían relacionarse por medio del uno y el cero. El uno, el único número sólo divisible por sí mismo (y por el uno, je) que no es primo. Su primicidad sacrificada  en aras del teorema fundamental de la aritmética. El cero, que separa lo positivo de lo negativo. Esta relación debida a Euler es la bella identidad:

e + 1 = 0

Entre estos, el número e cobra una especial relevancia para el alumno de biología interesado en los procesos y modelos de la ecología y la genética de poblaciones. Eso pensé cuando e comenzó a cruzarse en mi camino con más frecuencia que el resto. Con exagerada, incluso cansina, frecuencia, desde el punto de vista del estudiante que sólo veía una letra sin sentido, incomprensible y reiteradamente asociada a logaritmos, derivadas e integrales. Para empeorar las cosas, a nadie parecía perturbar y tampoco nadie se molestaba en explicar la omnipresencia de la dichosa letra-número. Ni siquiera los genéticos, la familia más matemática de la tribu de biólogos, parecían tener mucho que decir sobre el tema. Soy de los que necesitan explicaciones para poder seguir avanzando. La siguiente entrada narra en unas breves pinceladas la historia de mi búsqueda para entenderme con e

 El e-bicho logaritmico (modificado de G Bessiere, trad por A.G.T Ed. Naval, 1946)


En los comienzos de mi, inacabado viaje hacia el número e, fue particularmente clarificadora lo que llamaré la analogía del bicho virtual logarítmico. Me explico. Imaginemos que simulamos en nuestro ordenador una entidad biológica cualquiera (hongo, bicho o planta virtual) muy simple y con sólo una característica cambiante en el tiempo, a saber, que aumenta de tamaño en una sola dimensión.  El tamaño inicial de nuestro e-bicho será 1 unidad de tamaño virtual y programamos la regla de que su crecimiento en unidades por año es, en todo momento, equivalente a su tamaño actual. Así, inicialmente en tiempo simulación 0, crece a razón de 1 unidad anual; cuando mida 1,235 unidades, crecerá 1,235 unidades anuales, etc, etc.

Para saber cuánto va a medir nuestro e-bicho tras un breve lapso de tiempo, dividimos el año en muchas partes muy pequeñas, cada una de las cuales denominamos instante. Por tanto, para N suficientemente grande,  1/N corresponderá a un instante. Puesto que, por la regla antes definida, la ganancia anual en el instante primero es su tamaño inicial que vale 1, la ganancia instantánea (no anual) será una enésima parte de ese 1, esto es, 1/N.

Por tanto el nuevo tamaño tras el primer instante será
    1 + 1/N.

En el segundo instante ganará la enésima parte de su tamaño actual, por tanto tendremos

    (1 + 1/N ) + (1 + 1/N) / N = 1 + 2/N + 1/N2 = (1 + 1/N)2

y así sucesivamente para los siguientes instantes. Como hemos dividido el año en N instantes tendremos finalmente que el tamaño de nuestro e-bicho tras un año (= N instantes) será

    (1 + 1/N)N

No está mal, pero ahora surge un problema práctico. ¿Cuál es el tamaño de nuestro e-bicho? ¡El público ruge pidiendo un número! Ahora bien, ¿quién conoce el número N de instantes en un año? esta no es una pregunta fácil. A lo sumo, uno puede indicar que son muchos y por tanto N será grande, pero cuánto es grande. En este punto y en el contexto de crisis actual seguro que a alguno el presente año 2012 se le está haciendo especialmente largo, como si viniera con un extra de instantes... Perdón, estoy divagando...

Desde un punto de vista formal, el número infinitamente grande de instantes infinitamente pequeños utiliza el recurso del límite, que nos dice que N tiende a tan grande que no termina (equivalentemente pero en términos del análisis no estándar,  N es un número ilimitado; o el instante, un infinitesimal). En cualquier caso, y desde un punto de vista más práctico, podemos dar un valor concreto a N y asumir como aproximación bastante tosca el valor de 31,5 millones de instantes para un año. Es decir, nuestro instante vale aproximadamente un segundo. Rápidamente podemos calcular el tamaño de nuestro e-bicho que será:


(1 + 0,032 x 10-6) 31500000 = 2.7182817853117158805093639805235.

Si nuestro instante valiera un día tendríamos 


(1 + 1/365)365 = 2.7145674820218743031938863066851 

y si valiera un mes (1 + 1/12)12 = 2.6130352902246781602995330443549

Que no son sino distintas aproximaciones al valor constante del número e que es precisamente el límite de (1 + 1/N)N para N cuando N tiende a infinito.

Jacob Bernoulli fue el primero que calculó este límite. Inicialmente se llamaba b y fue Euler quien, al desarrollar la función exponencial mediante series infinitas, introdujo la notación con la letra e que ahora conocemos. Nuestro e-bicho tras un año creciendo, mide e unidades. Se deja como ejercicio para el sufrido lector, el comprobar, aplicando la misma regla antes indicada, que nuestro e-bicho en el segundo año medirá e2 unidades y así sucesivamente. Es decir, crece exponencialmente con el número de años y la base es e, de ahí que digamos que el e-bicho sea logarítmico puesto que podemos medir su crecimiento anual usando los exponentes a los que está elevado e, es decir, los logaritmos.


Primeros atisbos de respuesta a la pregunta de un biólogo enfrentado a e


He aquí nuestra primera pista respecto a la pregunta ¿porqué aparece e en tantos modelos de la biología? Vemos que, si medimos un crecimiento o cambio por unidad de variable, y este crecimiento vale exactamente el valor de la entidad que cambia (p.ej. crece lo mismo que pesa o mide, etc), nos acercaremos al valor del número e, tanto más, cuanto más pequeño sea el lapso de tiempo en que medimos el cambio. 


¿Porqué digo que lo anterior es una pista? pues porque en Biología es muy común hallar situaciones donde los procesos de cambio dependen o son regulados en función del propio valor de la entidad que cambia, bien en sentido positivo o negativo. Por ejemplo, el crecimiento de una población será mayor cuanto mayor sea la población, al menos en tanto haya recursos disponibles. La competencia entre especies, el control de las reacciones en el metabolismo, la expansión de una epidemia, etc, etc.

El cambio de ex según varía x es ex
 

La derivada de una función f es su incremento por unidad de variable x. Desde un punto de vista analítico, la derivada de una función f en un punto a de su dominio es el límite en el que x tiende a a de  (f(x) – f(a)) / (xa) que también podemos expresar como el límite cuando h tiende a 0 de (f(a+h) – f(a))/h donde hemos sustituido x = a+h, Quedémonos con esta última definición.
 

Vamos a considerar la función f(x) = ex. Por tanto f(a) = ea. El incremento infinitesimal h utilizando nuestra notación previa será 1/N donde N tiende a infinito. Aplicando la definición dada arriba, la derivada de la función ex en el punto a será el límite cuando N tiende a infinito de

(
ea+1/Nea) / (1/N) = (ea e1/Nea ) / (1/N) = (ea(1 + 1/N) – ea ) / (1/N) = ea
(nótese que hemos sustituido
e1/N = 1 + 1/N por definición de e).

Sustituyendo a por x tenemos finalmente que  


    d(ex) / d(x) = ex

es decir, la derivada de ex es ella misma, algo que ya sabíamos, pues la función ex, es "famosa" por eso mismo. 

En el caso de la Biología es más común que el cambio o la evolución de la función no sea igual sino proporcional a su propio valor, que entonces sería ekx y aplicando de nuevo la definición de derivada llegamos a:

    d(eka) = Keka.


Mi primera ecuación diferencial


Una vez, hace ya demasiados años, estaba yo en quinto de carrera y además en clase y para colmo, atendiendo a las explicaciones del profesor. Se hablaba de genética y había un silencio atento, pues el profe era bueno. Ocurrió de súbito, así ocurren siempre estas cosas en la vida, cuando no te lo esperas. Lo que aquel hombre había escrito en la pizarra se parecía a una ecuación. Pero había algo extraño, algo que no terminaba de encajar. Una ecuación, pensaba yo por aquellos tiempos, tiene que llevar su parte de y y su parte de x…, esas partes pueden ser más o menos complicadas pero ahí se acaba la cosa, o debería. A lo sumo, y ya en territorio comanche, si es derivada pues la y prima y las x. O si, peor aún, es integral pues el simbolito "ese" y dentro la parte de x con la dx. Pero no, aquel alien con forma de ecuación no encajaba en ninguna categoría conocida. En aquello coexistían la y con la x y con la derivada de y, todo revuelto. 


Mi sorpresa fue inmensa cuando, sin apenas atisbo de nervios por lo que había osado plantarnos en la pizarra, nos comentó, creo recordar que con cierta sorna, que aquello no era sino era una ecuación diferencial. No había peligro, dijo, pues no era más que una ecuación que llevaba una derivada dentro. Recuerdo perfectamente aquella sensación agridulce de pensar por un lado, que efectivamente no parecía para tanto la cosa, pero por otro, todas las alarmas saltando al pensar que, si ya las derivadas se bastaban solas para complicarle la vida a uno, nada bueno podía esperarse tras el hecho de introducirlas dentro de otra ecuación. No recuerdo qué ecuación era aquella pero sí que, ese simple comentario, desnudando de parte de su oscuro misterio a las temidas ecuaciones diferenciales, me sirvió para posteriormente profundizar un poco en su estudio, aunque siempre con una “mirada” biológica. 

Supe así, que había ecuaciones diferenciales de primer orden, de orden n, ecuaciones no lineales, estabilidad,  ecuaciones en derivadas parciales, etc. La enfermedad contraída fue tan grave como para llegar a impartir un curso de postgrado de ecuaciones diferenciales para biólogos (dos alumnas, a día de hoy, ambas retiradas de la investigación, quiero pensar que por motivos totalmente ajenos a aquel curso). Pasó el tiempo, y hondo fue mi pesar el día que comprendí que nada de todo esto era suficiente para describir los modelos más interesantes, y todavía básicamente sencillos, en genética de poblaciones donde lo necesario era, y es, otro tipo de ecuaciones, llamadas ecuaciones diferenciales estocásticas. Pero esa es otra historia...

Si has llegado hasta aquí, querido lector, cuentas con todo mi aprecio y también con algo de mi asombro. Por tu parte, acaso estás preguntándote con cierta melancolía, sobre los caminos que te han llevado hasta una entrada de blog como esta. ¿Qué puede haber fallado? pensarás... Por otro lado, aparentemente hemos abandonado a e en los últimos párrafos. Pero, como se suele decir, no hay fallo, está aquí mismo e inmediatamente retorna al escenario en, lo prometo, el último acto.



El número e, las ecuaciones diferenciales y la evolución de poblaciones varias


Veamos. Un modelo matemático en que aparece una expresión relacionando una función f(x), con su primera o sucesivas derivadas, es una ecuación diferencial ordinaria. Es decir, conocida la relación entre una función f, su variable x y sus derivadas, lo que deseamos es encontrar la función incognita que satisfaga esa relación. Resolver la ecuación diferencial consiste en integrarla. Recordemos aquí, que la función que relaciona magnitudes y crecimientos (aquella que es proporcional a su derivada) es
ekx y por tanto es de esperar que el número e juegue un importante papel en la interpretación de las ecuaciones diferenciales, como así es.

Un tipo de modelos sencillos y muy comunes en biología de poblaciones, ecología, epidemiología, etc. toma como variable independiente el tiempo t de modo que la función y(t) representa a los individuos de la población, por ejemplo su número, siendo la derivada el cambio del tamaño de población en el tiempo. He aquí la primera respuesta muy genérica a la pregunta de porqué aparecía el número e por todas partes en biología en general y de poblaciones en particular. El tipo de modelo que relaciona cantidad de individuos o moléculas o virus, con su evolución (cambio) en el tiempo son las ecuaciones diferenciales cuya solución involucra casi por definición al número e.

Parece que fuel el economista Tomas Malthus (1766-1834) el que primero observó que muchas poblaciones biológicas crecen de modo proporcional a la población. En genética de poblaciones es común usar la letra N para la variable del número de individuos de una población (por tanto aquí ya no corresponde al número de instantes). Por ello, la función y(t) la notaremos entonces como N(t), o más bien como N para simplificar la notación, y la razón dN/dt de cambio de la población (esto es, su derivada) es proporcional al valor actual de N. Por tanto

    dN/dt = rN.

La constante r es la razón de crecimiento (si es positiva) o disminución (si negativa). Si la población está creciendo asumimos r mayor que 0 e imponemos la condición inicial de que en tiempo 0 el tamaño poblacional es N0 es decir
N(0) = N0 .

La solución de esta ecuación la obtenemos si, agrupamos las N a un lado de la ecuación y la t en el otro, dN/N = rdt, e integramos ambos lados de modo que

log N = rt + C donde log es el logaritmo en base e y C es una constante. Por tanto

N =
ert+C  = C’ert. Y como en t=0, N = N0 tenemos que N0 = C’ y finalmente

    N =
N0 ert.
 

Que es el modelo Malthusiano de crecimiento exponencial antecesor del modelo conocido como crecimiento logístico, que surge al sustituir la constante r de razón de crecimiento por una función del tamaño poblacional N, r = f(N). El sentido de hacer esto es que, si bien en muchas poblaciones el modelo exponencial es correcto durante un tiempo definido, es obvio que los recursos son limitados y  mantener el crecimiento exponencial durante tiempo ilimitado no es factible.

El modelo logístico surge a partir del Malthusiano, para tener en cuenta que la razón de crecimiento depende de la población. Para incorporar un límite al tamaño poblacional según los recursos disponibles, basta elegir un f(N) que valga aproximadamente r para N pequeño, pero de modo que f(N) decrezca según aumenta N y que a partir de un N suficientemente grande, f(N) se haga negativo. La función más sencilla que cumple estos requisitos es 

    f(N) = raN donde a es positivo.

Si sustituimos esta función por r en la ecuación de Malthus obtenemos

    dN/dt = Nr(1 – N/K)  donde se ha hecho el cambio a = r /K.

Esta es la ecuación logística, introducida por el matemático belga P.F. Verlhulst como modelo para el crecimiento de la población humana, con la poca fortuna de disponer de datos de censo inadecuados con lo que su modelo cayó en el olvido. Lotka volvió a obtener la ecuación en 1925 y la llamó ley del crecimiento poblacional. Al parámetro r se le conoce como razón de crecimiento intrínseco y K es la cota superior a la que tiende el tamaño poblacional N tras un tiempo infinito. Por tanto a K se le conoce como nivel de saturación o, en ecología y biología de poblaciones, como la capacidad de carga de la población (carrying capacity). La solución de la ecuación incorpora, como no, nuestra ya conocida
ert.

La importancia de esta ecuación ha sido tal, que en ecología se distinguen dos estrategias de supervivencia conocidas como estrategia-r y estrategia-K en relación al conflicto entre número de descendencia versus cuidados parentales invertidos en la descendencia. La estrategia r fomenta muchos descendientes en los que se invierte escaso cuidado parental (corresponde a valores elevados de la tasa de crecimiento r y bajos de K) mientras que la estrategia K implica poca descendencia en la que se invierte mucho cuidado y por tanto tienen mayor probabilidad de supervivencia (baja r, elevada K). Si bien es necesario aclarar que a día de hoy, este modelo K-r ha sido superado por otros más completos, que incluyen distintos componentes de la historia vital de las especies teniendo en cuanta, por ejemplo, la estructura de edades.

Obviamente, queda mucho por decir sobre el papel que el número e tiene en la formalización y modelado biológicos, algo que, con cierto desenfado, he llamado biología del número e. El rastro de e lo podemos seguir a través de distribuciones probabilisticas de gran importancia en Biología como la Normal, la Poisson, etc, así como también en procesos estocásticos. Es clave en el estudio de la evolución de las secuencias de ADN, donde aparece la ecuación P =
eQt donde P y Q son matrices, que permite calcular las probabilidades de transición de unas secuencias de información genética a otras. También hallaremos a e en la dinámica de sistemas ecológicos, etc etc... En cualquier caso, paremos aquí. Aunque yo no esté satisfecho, y tú ¿lector? estés harto... A veces me pregunto ¿porqué e? ¿porqué precisamente entre el 2 y el 3?.. Pero dado que llevo dos días escribiendo esta entrada sin ton ni son, será mejor para todos, terminar aquí ahora.

PD: sí, ya sé que podía haber puesto alguna figura!


Bibliografía


Bessiere, G. "El cálculo integral fácil y atractivo" trad por A.G.T. Ed. Naval, 1946.

Boyce, WE, DiPrima, RC. "Ecuaciones diferenciales y problemas con valores en la frontera". Ed. Limusa, 1998.

Dunham, W. "Euler. El maestro de todos los matemáticos". Ed. NIVOLA, 2000.

Roughgarden, J. "Theory of population genetics and evolutionary ecology. An introduction". Ed.Prentice-Hall, 1996.



“Esta entrada participa en la edición 3.1415926 del Carnaval de Matemáticas, alojado en el blog Series divergentes.”

1 comentario:

  1. Perfecto, estaba buscando una buena explicacion y ahora lo tengo todo claro. Gracias

    ResponderEliminar