Kubernetes Basics
Concetti di base di Kubernetes
L'autore originale di questa pagina è Jorge (leggi il suo post originale qui)
Architettura e concetti di base
Cosa fa Kubernetes?
Consente l'esecuzione di uno o più container in un motore di container.
La pianificazione consente una missione efficiente dei container.
Mantiene i container attivi.
Consente la comunicazione tra i container.
Consente tecniche di distribuzione.
Gestisce volumi di informazioni.
Architettura
Nodo: sistema operativo con pod o pod.
Pod: Wrapper attorno a un container o più container. Un pod dovrebbe contenere solo un'applicazione (quindi di solito, un pod esegue solo 1 container). Il pod è il modo in cui Kubernetes astrae la tecnologia dei container in esecuzione.
Servizio: Ogni pod ha 1 indirizzo IP interno dall'intervallo interno del nodo. Tuttavia, può essere anche esposto tramite un servizio. Il servizio ha anche un indirizzo IP e il suo obiettivo è mantenere la comunicazione tra i pod in modo che se uno muore il nuovo sostituto (con un diverso IP interno) sarà accessibile esposto nello stesso IP del servizio. Può essere configurato come interno o esterno. Il servizio agisce anche come bilanciamento del carico quando 2 pod sono collegati allo stesso servizio. Quando viene creato un servizio, è possibile trovare gli endpoint di ogni servizio eseguendo
kubectl get endpoints
Kubelet: Agente primario del nodo. Il componente che stabilisce la comunicazione tra il nodo e kubectl e può eseguire solo pod (tramite il server API). Il kubelet non gestisce i container che non sono stati creati da Kubernetes.
Kube-proxy: è il servizio responsabile delle comunicazioni (servizi) tra l'apiserver e il nodo. La base è un IPtables per i nodi. Gli utenti più esperti potrebbero installare altri kube-proxy da altri fornitori.
Container sidecar: I container sidecar sono i container che devono essere eseguiti insieme al container principale nel pod. Questo modello sidecar estende e migliora la funzionalità dei container attuali senza modificarli. Oggi sappiamo che utilizziamo la tecnologia dei container per incapsulare tutte le dipendenze per l'esecuzione dell'applicazione ovunque. Un container fa solo una cosa e lo fa molto bene.
Processo master:
Api Server: È il modo in cui gli utenti e i pod comunicano con il processo master. Dovrebbero essere consentite solo richieste autenticate.
Scheduler: La pianificazione si riferisce a garantire che i pod siano abbinati ai nodi in modo che Kubelet possa eseguirli. Ha sufficiente intelligenza per decidere quale nodo ha più risorse disponibili per assegnare il nuovo pod ad esso. Si noti che lo scheduler non avvia nuovi pod, comunica solo con il processo Kubelet in esecuzione all'interno del nodo, che avvierà il nuovo pod.
Kube Controller Manager: Controlla le risorse come i set di repliche o le distribuzioni per verificare se, ad esempio, il numero corretto di pod o nodi è in esecuzione. Nel caso in cui manchi un pod, comunicherà con lo scheduler per avviarne uno nuovo. Controlla la replica, i token e i servizi di account per l'API.
etcd: Archiviazione dati, persistente, coerente e distribuita. È il database di Kubernetes e lo storage chiave-valore in cui conserva lo stato completo dei cluster (ogni modifica viene registrata qui). Componenti come lo Scheduler o il Controller Manager dipendono da questa data per sapere quali modifiche sono state apportate (risorse disponibili dei nodi, numero di pod in esecuzione...)
Cloud Controller Manager: È il controller specifico per il controllo dei flussi e delle applicazioni, ad esempio: se si hanno cluster in AWS o OpenStack.
Si noti che poiché potrebbero esserci diversi nodi (che eseguono diversi pod), potrebbero anche esserci diversi processi master con accesso bilanciato al server API e la loro etcd sincronizzata.
Volumi:
Quando un pod crea dati che non devono essere persi quando il pod scompare, dovrebbero essere archiviati in un volume fisico. Kubernetes consente di allegare un volume a un pod per persistere i dati. Il volume può essere nella macchina locale o in un archivio remoto. Se si eseguono pod su diversi nodi fisici, è necessario utilizzare un archivio remoto in modo che tutti i pod possano accedervi.
Altre configurazioni:
ConfigMap: È possibile configurare URL per accedere ai servizi. Il pod otterrà i dati da qui per sapere come comunicare con il resto dei servizi (pod). Si noti che questo non è il posto consigliato per salvare le credenziali!
Secret: Questo è il luogo in cui memorizzare dati segreti come password, chiavi API... codificati in B64. Il pod sarà in grado di accedere a questi dati per utilizzare le credenziali richieste.
Deployments: Qui vengono indicati i componenti da eseguire tramite Kubernetes. Di solito, un utente non lavorerà direttamente con i pod, i pod sono astratti in ReplicaSets (numero di pod replicati), che vengono eseguiti tramite i deployments. Si noti che i deployments sono per applicazioni senza stato. La configurazione minima per un deployment è il nome e l'immagine da eseguire.
StatefulSet: Questo componente è specificamente destinato a applicazioni come database che devono accedere allo stesso archivio.
Ingress: Questa è la configurazione che viene utilizzata per esporre l'applicazione pubblicamente con un URL. Si noti che ciò può essere fatto anche utilizzando servizi esterni, ma questa è la modalità corretta per esporre l'applicazione.
Se si implementa un Ingress, sarà necessario creare Ingress Controllers. L'Ingress Controller è un pod che sarà il punto finale che riceverà le richieste, le verificherà e le bilancerà sui servizi. l'Ingress Controller inoltrerà la richiesta in base alle regole di ingress configurate. Si noti che le regole di ingress possono puntare a percorsi diversi o addirittura a sottodomini di diversi servizi interni di Kubernetes.
Una pratica di sicurezza migliore sarebbe utilizzare un bilanciatore di carico cloud o un server proxy come punto di ingresso per non avere alcuna parte del cluster Kubernetes esposta.
Quando viene ricevuta una richiesta che non corrisponde a nessuna regola di ingress, l'Ingress Controller la indirizzerà al "Default backend". È possibile eseguire il comando
describe
sull'Ingress Controller per ottenere l'indirizzo di questo parametro.minikube addons enable ingress
Infrastruttura PKI - Autorità di Certificazione CA:
CA è la radice fidata per tutti i certificati all'interno del cluster.
Consente ai componenti di convalidarsi reciprocamente.
Tutti i certificati del cluster sono firmati dalla CA.
ETCd ha il suo certificato.
Tipi:
Certificato apiserver.
Certificato kubelet.
Certificato scheduler.
Azioni di base
Minikube
Minikube può essere utilizzato per eseguire alcuni test rapidi su Kubernetes senza la necessità di distribuire un intero ambiente Kubernetes. Eseguirà i processi master e node in una sola macchina. Minikube utilizzerà virtualbox per eseguire il nodo. Vedi qui come installarlo.
Concetti di base di Kubectl
Kubectl
è lo strumento da riga di comando per i cluster di Kubernetes. Comunica con il server API del processo master per eseguire azioni in Kubernetes o per richiedere dati.
Dashboard di Minikube
Il dashboard ti permette di vedere più facilmente cosa sta eseguendo Minikube, puoi trovare l'URL per accedervi in:
Esempi di file di configurazione YAML
Ogni file di configurazione ha 3 parti: metadata, specification (cosa deve essere avviato), status (stato desiderato). All'interno della specifica del file di configurazione del deployment è possibile trovare il template definito con una nuova struttura di configurazione che definisce l'immagine da eseguire:
Esempio di Deployment + Service dichiarati nello stesso file di configurazione (da qui)
Poiché un servizio di solito è correlato a un deployment, è possibile dichiarare entrambi nello stesso file di configurazione (il servizio dichiarato in questa configurazione è accessibile solo internamente):
Esempio di configurazione di un servizio esterno
Questo servizio sarà accessibile esternamente (controlla gli attributi nodePort
e type: LoadBalancer
):
Questo è utile per il testing, ma per la produzione dovresti avere solo servizi interni e un Ingress per esporre l'applicazione.
Esempio di file di configurazione Ingress
Questo esporrà l'applicazione su http://dashboard.com
.
Esempio di file di configurazione dei segreti
Nota come le password siano codificate in B64 (che non è sicuro!)
Esempio di ConfigMap
Un ConfigMap è la configurazione fornita ai pod in modo che sappiano come individuare e accedere ad altri servizi. In questo caso, ogni pod saprà che il nome mongodb-service
è l'indirizzo di un pod con cui possono comunicare (questo pod eseguirà un'istanza di mongodb):
Quindi, all'interno di una configurazione di deployment, questo indirizzo può essere specificato nel seguente modo in modo che venga caricato all'interno dell'env del pod:
Esempio di configurazione del volume
Puoi trovare diversi esempi di file di configurazione yaml per lo storage su https://gitlab.com/nanuchi/youtube-tutorial-series/-/tree/master/kubernetes-volumes. Nota che i volumi non sono all'interno dei namespace
Namespaces
Kubernetes supporta cluster virtuali multipli supportati dallo stesso cluster fisico. Questi cluster virtuali sono chiamati namespaces. Sono pensati per essere utilizzati in ambienti con molti utenti distribuiti su più team o progetti. Per cluster con pochi o decine di utenti, non dovresti aver bisogno di creare o pensare ai namespaces. Dovresti iniziare ad utilizzare i namespaces solo per avere un migliore controllo e organizzazione di ogni parte dell'applicazione distribuita in Kubernetes.
I namespaces forniscono uno scope per i nomi. I nomi delle risorse devono essere univoci all'interno di un namespace, ma non tra i namespaces. I namespaces non possono essere nidificati l'uno dentro l'altro e ogni risorsa di Kubernetes può essere solo in un namespace.
Ci sono 4 namespaces di default se stai usando minikube:
kube-system: Non è destinato all'uso degli utenti e non dovresti toccarlo. È per i processi master e kubectl.
kube-public: Dati accessibili pubblicamente. Contiene un configmap che contiene informazioni sul cluster.
kube-node-lease: Determina la disponibilità di un nodo.
default: Lo spazio dei nomi che l'utente utilizzerà per creare risorse.
Nota che la maggior parte delle risorse di Kubernetes (ad esempio, pod, servizi, controller di replica e altri) sono in alcuni namespace. Tuttavia, altre risorse come le risorse di namespace e le risorse di basso livello, come i nodi e i volumi persistenti, non sono in un namespace. Per vedere quali risorse di Kubernetes sono e non sono in un namespace:
Puoi salvare il namespace per tutti i comandi successivi di kubectl in quel contesto.
Helm
Helm è il gestore di pacchetti per Kubernetes. Consente di impacchettare file YAML e distribuirli in repository pubbliche e private. Questi pacchetti sono chiamati Helm Charts.
Helm è anche un motore di template che consente di generare file di configurazione con variabili:
Secret di Kubernetes
Un Secret è un oggetto che contiene dati sensibili come una password, un token o una chiave. Tali informazioni potrebbero altrimenti essere inserite in una specifica Pod o in un'immagine. Gli utenti possono creare Secret e il sistema crea anche Secret. Il nome di un oggetto Secret deve essere un valido nome di sottodominio DNS. Leggi qui la documentazione ufficiale.
I Secret potrebbero essere cose come:
API, chiavi SSH.
Token OAuth.
Credenziali, password (testo normale o b64 + crittografia).
Informazioni o commenti.
Codice di connessione al database, stringhe... .
Ci sono diversi tipi di Secret in Kubernetes
Tipo incorporato | Utilizzo |
---|---|
Opaque | dati definiti dall'utente arbitrari (predefinito) |
kubernetes.io/service-account-token | token dell'account di servizio |
kubernetes.io/dockercfg | file ~/.dockercfg serializzato |
kubernetes.io/dockerconfigjson | file ~/.docker/config.json serializzato |
kubernetes.io/basic-auth | credenziali per l'autenticazione di base |
kubernetes.io/ssh-auth | credenziali per l'autenticazione SSH |
kubernetes.io/tls | dati per un client o server TLS |
bootstrap.kubernetes.io/token | dati del token di bootstrap |
Il tipo Opaque è quello predefinito, la coppia chiave-valore tipica definita dagli utenti.
Come funzionano i Secret:
Il seguente file di configurazione definisce un secret chiamato mysecret
con 2 coppie chiave-valore username: YWRtaW4=
e password: MWYyZDFlMmU2N2Rm
. Definisce anche una pod chiamata secretpod
che avrà username
e password
definiti in mysecret
esposti nelle variabili d'ambiente SECRET_USERNAME
e SECRET_PASSWORD
. Monta anche il secret username
all'interno di mysecret
nel percorso /etc/foo/my-group/my-username
con permessi 0640
.
Secreti in etcd
etcd è un archivio chiave-valore coerente e altamente disponibile utilizzato come archivio di supporto di Kubernetes per tutti i dati del cluster. Accediamo ai segreti archiviati in etcd:
Vedrai che i certificati, le chiavi e gli URL sono situati nel file system. Una volta ottenuti, sarai in grado di connetterti a etcd.
Una volta che riesci a stabilire la comunicazione, sarai in grado di ottenere i segreti:
Aggiunta di crittografia all'ETCD
Di default, tutti i segreti vengono archiviati in chiaro all'interno di etcd a meno che non si applichi uno strato di crittografia. L'esempio seguente si basa su https://kubernetes.io/docs/tasks/administer-cluster/encrypt-data/
Dopo di ciò, è necessario impostare il flag --encryption-provider-config
sul kube-apiserver
per puntare alla posizione del file di configurazione creato. Puoi modificare /etc/kubernetes/manifest/kube-apiserver.yaml
e aggiungere le seguenti righe:
Scorri verso il basso in volumeMounts:
Scorri verso il basso in volumeMounts fino a hostPath:
Verifica che i dati siano criptati
I dati vengono criptati quando vengono scritti su etcd. Dopo aver riavviato il tuo kube-apiserver
, ogni nuovo segreto creato o aggiornato dovrebbe essere criptato quando viene memorizzato. Per verificare ciò, puoi utilizzare il programma a riga di comando etcdctl
per recuperare il contenuto del tuo segreto.
Crea un nuovo segreto chiamato
secret1
nel namespacedefault
:
Utilizzando il comando etcdctl, leggi quel segreto da etcd:
ETCDCTL_API=3 etcdctl get /registry/secrets/default/secret1 [...] | hexdump -C
dove [...]
devono essere gli argomenti aggiuntivi per connettersi al server etcd. 3. Verifica che il segreto memorizzato abbia il prefisso k8s:enc:aescbc:v1:
, che indica che il provider aescbc
ha criptato i dati risultanti. 4. Verifica che il segreto venga correttamente decrittato quando viene recuperato tramite l'API:
dovrebbe corrispondere a mykey: bXlkYXRh
, mydata è codificato, controlla decodifica di un segreto per decodificare completamente il segreto.
Poiché i segreti vengono criptati durante la scrittura, eseguire un aggiornamento su un segreto cripterà quel contenuto:
Suggerimenti finali:
Cerca di non conservare segreti nel FS, ottienili da altri luoghi.
Dai un'occhiata a https://www.vaultproject.io/ per aggiungere ulteriore protezione ai tuoi segreti.
Riferimenti
Last updated