Anda di halaman 1dari 10

1

Machine Learning: Aplicações em Smart Grid,


Aspectos Metodológicos, Estudos de Caso e
Discussão
 proteção adequados são necessários para garantir a operação
Abstract—O setor elétrico vem passando por um processo segura da rede inteligente, a proteção dos dados, e impedir
contínuo de transformação, que tem ocasionado profundas qualquer possibilidade de ataque à integridade do sistema
mudanças em todo os seus segmentos. Essa transformação tem um elétrico de potência [2], [3].
carácter energético, cujo vetor são as fontes renováveis de geração
Técnicas de ML, ou aprendizado de máquina, constituem-se
de energia elétrica, e também um carácter tecnológico, decorrente
de avanços em áreas como medição e comunicação. Como em uma solução atraente para o processamento de grandes
consequência, novas preocupações emergiram, sendo a segurança volumes de dados e para a implementação de soluções de
cibernética dos dados uma das principais. Adicionalmente, os segurança eficazes. Um desafio natural que surge com o big
procedimentos de planejamento e operação dos sistemas elétricos data é a elaboração de um procedimento eficiente para analisá-
de potência precisaram ser revistos, e muitas tarefas antes los, extraindo-se informações valiosas. Pois sem a extração de
rotineiras têm se tornado complexas e desafiadoras. Neste cenário,
informações úteis, os dados armazenados possuem pouco, ou
ferramentas baseadas em técnicas de Machine Learning (ML) vêm
ganhando destaque, em função de seu ecletismo e da sua nenhum valor. O termo ML se refere à aprendizagem e à
potencialidade. Portanto, o artigo detalha estas técnicas no realização de previsões (ou predições), a partir dos dados
contexto de sistemas Smart Grid (SG), sendo empreendida uma disponíveis de um sistema. Uma ML é composta por vários
revisão bibliográfica acerca do tema, e abordados os seus aspectos algoritmos que analisam os dados, através de um conjunto de
metodológicos e conceituais. Estudos de caso contendo aplicações instruções, para produzir previsões e/ou decisões, orientadas
de ML em sistemas SG são apresentados. Por fim, os aspectos mais
pelos dados [1].
relevantes sobre o tema são discutidos e as principais conclusões
apontadas. As MLs podem ser empregadas em vários aplicativos para a
segurança de redes inteligentes. Pode-se verificar também que
Index Terms—Machine Learning, Smart Grid, big data, Internet o setor de energia renovável necessitará cada vez mais destas
of Things. técnicas, em função do aumento das incertezas nos modernos
sistemas elétricos de potência, ocasionado por este tipo de
I. INTRODUÇÃO energia. Com relação à segurança cibernética, as técnicas
podem ser divididas em duas categorias principais: proteção e
O alto volume de dados de medições oriundas dos
modernos sistemas elétricos de potência, sintetizados com
o termo SG, torna bastante complexa a análise de tais dados.
detecção. As estratégias de proteção podem ser de hardware e
administrativas, juntamente com as proteções de software mais
Um gerenciamento dinâmico da energia é necessário para comuns. Já as estratégias de detecção podem ser realizadas
processar a enorme quantidade de dados, a fim de que sejam aplicando-se técnicas de ML, que podem prever ameaças e
disponibilizadas aplicações, tais como: otimização do identificar anomalias de acordo com as características padrões
planejamento eletro-energético, monitoramento do sistema, [4].
operação em tempo real, e planejamento da expansão. Dados de As abordagens tradicionais de simulação no domínio do
tal magnitude, que não podem ser manipulados através de tempo, baseadas em modelos de sistemas de potência são, de
processos tradicionais, são denominados big data, termo que forma geral, computacionalmente intensivas e podem não
vem ganhando grande destaque na literatura [1]. atender aos requisitos de aplicações em tempo real. Portanto, os
Uma parte dos dados produzidos em um SG contém pesquisadores têm recorrido a técnicas de ML para a tomada de
informações confidenciais de usuários individuais, que decisões em tempo real, ou quase real. A abordagem de ML
precisam estar protegidas por regulamentações legais. Além apresenta uma capacidade de generalização, onde o modelo
disso, os dados contêm informações sigilosas de organizações baseado em dados, se treinado adequadamente, pode fazer
privadas, de órgãos governamentais, e de sistemas interligados previsões precisas, a partir de medidas para as quais não foi
que envolvem um significativo número de agentes. Portanto, a exposto anteriormente [5].
manipulação de tais dados pode afetar a segurança operacional Em termos operacionais, um aspecto crítico é a
de um sistema elétrico. Um SG integrado à Internet of Things observabilidade do estado atual do sistema de potência. Ou seja,
o conhecimento dos valores complexos de tensão de todas as
(IoT) consiste em um sistema ciber-físico, o que o torna barras do sistema, no menor tempo possível. Considerando-se
vulnerável a ataques cibernéticos. Portanto, sistemas de as grandes dimensões dos sistemas interconectados de
2

transmissão, as medições do sistema SCADA (Supevisory e metodológicos do tema. Na Seção IV, casos de aplicação são
Control and Data Acquisition) têm ocorrido a partir de locais abordados, ilustrando-se o emprego de técnicas de ML para a
geograficamente cada vez mais distantes. Isto tem tornado solução de problemas em sistemas SG. Por fim, a Seção V traz
complexo o processo de tomada de decisões rápidas, devido à a discussão de questões relevantes sobre o tema e as conclusões
grande quantidade de medições a serem processadas em cada principais do trabalho.
período de varredura. Neste contexto, a tecnologia de medição
fasorial sincronizada, baseada em dados de PMU (Phasor II. REVISÃO BIBLIOGRÁFICA
Measurement Unit), oferece informações precisas, Este capítulo aborda aspectos históricos em conjunto com as
sincronizadas com a mesma etiqueta de tempo projeções do conceito de ML atualmente em diferentes áreas de
(independentemente do local geográfico), e com alta taxa de pesquisa. O conceito de aprendizado de máquinas representa
amostragem (taxas entre 30 e 240 amostras por segundo). Tais uma ferramenta recente que conquistou a imaginação diversos
características têm motivado a aplicação de abordagens grupos distintos de usuários, combinando estatística,
baseadas em técnicas de ML para o monitoramento das otimização e ciência da computação na resolução dos mais
condições operacionais dos sistemas [6]. variados problemas. O aprendizado de máquina é uma
Quanto ao seu desempenho, a eficácia de uma ferramenta de aplicação da Inteligência Artificial (IA) na qual as máquinas
ML depende da capacidade de reprodução do comportamento recebem acesso aos dados e, com base nesses dados,
do sistema conhecido, representado pelo conjunto de dados de “aprendem” sem serem explicitamente programadas.
treinamento. Portanto, as abordagens existentes de ML O aprendizado de máquina nasceu como um ramo dentro do
geralmente empregam um método de força-bruta para gerar a campo principal da IA, que também inclui outros, como
base de conhecimento, a partir de simulações baseadas em Representação do Conhecimento, Percepção e Criatividade. O
modelos do sistema físico. Devido à complexidade termo “aprendizado de máquina” foi criado por Arthur Samuel,
computacional decorrente da grande quantidade de simulações em 1952, criando o primeiro algoritmo com poder de jogar e
necessárias, uma única base de conhecimento (inalterada) é aprender o jogo de damas. O processo de “aprendizado”
geralmente utilizada muitas aplicações. As ferramentas de ML correspondia à atualização incremental de um banco de dados
treinadas dessa maneira são passivas e apresentam três com movimentos (posições do tabuleiro) e sua pontuação, de
desvantagens principais, quando incorporadas a aplicativos de acordo com a probabilidade de sucesso posterior em ganhar ou
tempo real [7], [8]: perder o jogo. Quanto mais o algoritmo trabalhou, mais sua
capacidade de ganhar o jogo aumentou. Sendo está
 O conjunto de treinamento inicial é formulado em uma provavelmente a versão mais antiga da aprendizagem por
determinada condição operacional do sistema físico. reforço [9].
Quando as atualizações subsequentes não são Durante as décadas de 1960 e 1970, muitos pesquisadores
consideradas, a ferramenta de ML pode falhar, à medida ficaram encantados com o conceito de uma máquina puramente
que as condições operacionais do sistema evoluem. lógica, mas as limitações de memória e processamento do
 Quando os modelos de ML são atualizados, sem a computador eram extremamente maiores que os dias de hoje. A
redução da quantidade de simulações necessárias, o crença de que a inteligência humana poderia ser representada
treinamento baseado no mesmo método de simulação de através da lógica era generalizada, naturalmente levando a uma
força-bruta atrasa a retomada do aplicativo de tempo ênfase em sistemas baseados em regras, representando
real. conhecimento por meio de lógica (booleanas) e processamento
 A base de conhecimento é criada exclusivamente com de linguagem natural, sendo um ponto de vista
base no modelo do sistema de potência. Portanto, “computacionalista” [10].
quando a fidelidade do modelo é questionável, a Paralelamente, outros pesquisadores acreditavam que o foco
precisão das previsões, oriundas das ferramentas de ML, deveria ser dado a neurobiologia do nosso cérebro, afim de
é afetada negativamente. replicá-la (um ponto de vista conexionista), ficando esse
movimento conhecido como Redes Neurais Artificiais (RNA).
Neste cenário, pode-se constatar que ML é um tema ainda em O primeiro exemplo mais conhecido foi representado pelo
investigação e aperfeiçoamento, que tem ganho crescente Perceptron, o qual aplica uma regra de limiar para uma função
relevância em função dos desafios operacionais decorrentes das linear, afim de discriminar uma saída binária. Entretanto a
fontes renováveis de energia, e da disponibilização de lógica RNA é limitada a problemas linearmente separáveis,
qualificadas infraestruturas de medição e comunicação (Smart enquanto que problemas reais são frequentemente
Grid). Isto, por um lado, produz uma elevada massa de dados inerentemente não-lineares em sua natureza. Essa característica
(big data). Por outro, possibilita o desenvolvimento de técnicas levou a uma década com virtualmente nenhuma pesquisa em
baseadas em informação (Machine Learning, por exemplo) redes neurais, também conhecida como o "primeiro inverno
para a proposição de soluções tem tempo real. Neste contexto, IA".
o trabalho aborda tais questões detalhando a aplicação de O terceiro tópico de pesquisa relevante das décadas de 1960
técnicas de ML em sistemas de SG. O trabalho está dividido da e 1970 refere-se ao conceito de vizinho mais próximo (nearest
seguinte forma. Na Seção II, tem-se uma revisão bibliográfica neighbor). Marcando efetivamente a criação do campo
acerca do tema ML. A Seção III detalha os aspectos conceituais “reconhecimento de padrões” e o nascimento do conhecido
3

algoritmo K-vizinho mais próximo (K-NN). Seu princípio é continua sendo importante para as estruturas de relações das
simples: se tivermos um problema para resolver se procura por variáveis, mas com menos complexidade e rigidez. O intuito
situações mais semelhantes em banco de dados. Em outras do método é decompor o conhecimento em relações
palavras, dado um vetor de entrada (X), esse é classificado em individuais, inspiradas no conceito de casualidade e evidencia.
uma classe, para a variável alvo (Y) se tornar categórica. A peça Essas redes obtiveram sucesso particularmente na classificação
fundamental desse paradigma consiste em definir a de problemas e na geração automática de estruturas próprias
similaridade, que se resume à comparação de vetores. O desafio utilizando diferentes dados [14]
deste método é decidir o melhor número de exemplos Entretanto outra tendência ficou entre os anos 1980 e 1990,
semelhantes dos dados para usar no algoritmo, que devem ser com a criação do paradigma Kernel, mais especificamente com
determinados antes de seu treinamento [11]. o método Support Vector Machines (SVM). O algoritmo
Os anos 80 foi marcado pelo renascimento das RNAs com operado em sistema lineares e não lineares, separando as classes
poder computacional suficiente para permitir redes usando um hiperplano utilizando a função Kernel. Essa função
multicamadas e funções não-lineares. Utilizando uma função mapeia e transforma as variáveis de entrada em vetores com
sigmoide logística, afim de se obter um modelo de regressão variadas dimensões no espaço, onde após a classificação dos
logística, a base para o Multilayer Perceptron Algorith (MLP). dados de entrada, ocorre o treinamento do método, afim de se
O MLP está sempre totalmente conectado, ou seja, todos os moldar as estruturas capazes de classificar novos dados que
elementos em uma camada são conectados com todos os possam surgir. Cada variável nova é classificada de acordo com
elementos da camada subsequente. A com dois vetores de pesos os dados originais e projetada nos vetores de espaço, e sua
(W1 e W2) [12]. A ideia original do Perceptron pode ser distância maximizada na superfície de decisão entre as classes
observada na Figura 1 (A), enquanto sua evolução para [15].
multicamadas na Figura 1 (B). O aprendizado de máquinas apresentou altos e baixos ao
longo das décadas desde que foi concebida pela primeira vez,
mas finalmente seu progresso real pode transformar nosso
mundo. As principais razões para isso são O poder
computacional maciço está agora disponível a baixo custo e
pode ser provisionado na nuvem muito rapidamente. A
explosão na quantidade de dados (big data), juntamente com
uma capacidade de armazenamento quase ilimitada, onde esses
conjuntos de dados diversos fornecem material de treinamento
melhor para os algoritmos. E o aumento dos investimentos,
expandindo rapidamente a tecnologia utilizadas em diferentes
sistemas, superando humanos em tarefas como, por exemplo,
jogar xadrez, transcrever áudios, analisar imagens e
diagnosticar doenças.

A. Aplicação em Sistemas Elétricos de Potência


Nos últimos anos, várias aplicações utilizando ML foram
desenvolvidas, como modelos para classificar novas estruturas
astronômicas, detecção de transações bancárias fraudulentas,
sistemas de filtragem de informação que aprendem as
Fig. 1. Definição do Perpecptron (A) e sua evolução multicamadas (B). preferências de leitura do usuário, estudos neurobiológicos,
veículos autônomos. Ao mesmo tempo, houve um progresso
importante na base do aprendizado de máquina visando
A evolução do método MPL se deu a partir de 2010, com o
sistemas elétricos e seu diverso campo de aplicações prontas
conceito Deep Neural Nets (DNN). Esse paradigma surgiu para revolucionar a maneira como o setor de energia produz,
devido as novas arquiteturas sofisticadas, recursos
transmite e consome energia.
computacionais e quantidade de dados disponíveis.
Por meio do aprendizado de máquina, as empresas de energia
Diferentemente de um MLP, que sempre tem uma camada, um
podem transformar seus dados, a fim de melhorar a tomada de
DNN pode ter múltiplas camadas, às vezes dezenas ou centenas.
decisões tanto para a operação quanto para expansão do sistema
Apresentando frequentemente diferentes conjuntos de elétrico. O grande volume de informações coletadas por
neurônios conectados a diferentes partes da camada
sensores inteligentes pode ser utilizado na análise e ação em
subsequente [13].
tempo real. Entretanto essas enormes quantidades de dados
Durante o período de 1982 e 1985 outra aproximação foi exibidas pela operação de sistemas SG são impossíveis de
criada afim de resolver as teorias probabilísticas, fugindo da
serem processadas pelos operadores humanos em tempo hábil.
mecanização do conhecimento humano por códigos e regras. Os avanços nos algoritmos de aprendizagem profunda se
Esse conceito foi criado por Judea Pearl, sendo batizado de
apresentam como a solução para avaliação dos dados,
Bayesian Network (BN) onde o domínio do conhecimento
4

possibilitando que a análise em tempo real dos valores lidos, de máquinas pode oferecer grandes benefícios para os
identificando padrões e anomalias nos conjuntos de dados e usuários. Entretanto a adesão atual do setor de permanece
permitindo que as concessionárias tomem decisões no local baixa, com poucas empresas implementando esses sistemas
sobre a melhor forma de alocar os recursos de energia. Esses em escala. Os EUA é um dos principais exemplos de
algoritmos de aprendizagem profunda tem o poder de investimentos para atualizar e modernizar a rede, onde o
revolucionar o lado da demanda e da oferta para a economia de departamento de energia investiu US$ 4,5 bilhões em
energia. Alcançando melhorias reais e mensuráveis em infraestrutura de rede inteligente. Isso inclui a instalação de
comparação aos métodos tradicionais. Muitos setores podem se mais de 15 milhões de medidores inteligentes para monitorar
beneficiar do aprendizado de máquina [16-19], como pode ser o uso de energia.
observado:
III. ASPECTOS METODOLÓGICOS
 Previsão de carga - As previsões de curto prazo são O termo ML (Machine Learning), ou Aprendizado de
vitais para as concessionárias, sendo que o aprendizado Máquina, consiste em um método de análise de dados que
de máquina pode ser usado para prever a oferta e a automatiza o desenvolvimento de modelos analíticos, por
demanda em tempo real e otimizar o despacho meio de algoritmos que aprendem interativamente a partir de
econômico de carga. dados, permitindo assim que os computadores encontrem
 Otimização de rendimento - Os provedores de energia insights ocultos sem serem explicitamente programados para
podem otimizar a eficiência de geração com ajustes em procurar algo específico [1], [3], [10], [11], [17].
tempo real em seus ativos e gerenciamento aprimorado As duas técnicas mais adotadas de ML são a aprendizagem
de recursos distribuídos, automaticamente libera energia supervisionada e a aprendizagem não supervisionada, porém
através da rede para fornecer energia mais confiável e existem outros tipos. Na sequência, estas e outras técnicas
maior escolha do cliente. são descritas.
 A manutenção preditiva - reforçada com drones para Aprendizagem supervisionada: Os algoritmos são
inspeções de ativos, substituindo inspeções manuais treinados por meio de exemplos rotulados, como uma entrada
demoradas e arriscadas, identificando automaticamente na qual a saída desejada é conhecida. Por exemplo, um
defeitos e falhas sem interromper as operações equipamento poderia ter pontos de dados rotulados como “F”
 Gerenciamento de demanda - automatizado e tornado (falha) ou “E” (executa). O algoritmo de aprendizado recebe
mais inteligente com o aprendizado de máquina um conjunto de entradas junto com as saídas corretas
 Roubo de energia - pode ser usado para detectar padrões correspondentes, e aprende ao comparar a saída real com as
de uso, histórico de pagamento e outros dados do cliente saídas corretas para encontrar erros. Ele, então, modifica o
que podem sinalizar um comportamento irregular modelo de acordo. Através de métodos como classificação,
 Gerenciamento de interrupção - utilizando modelos de regressão e gradient boosting, o aprendizado supervisionado
validação de análise para prever e identificar utiliza padrões para prever os valores de rótulos em dados
interrupções, permitindo gerenciamento de recursos, não-rotulados adicionais. O aprendizado supervisionado é
reduzindo o tempo de inatividade e melhorando a comumente empregado em aplicações nas quais dados
confiabilidade. históricos preveem eventos futuros prováveis. Por exemplo,
 Percepções dos clientes - permite que as concessionárias ele pode antecipar quando transações via cartão de crédito
criem preços de eletricidade que maximizem suas são passíveis de fraude ou qual segurado tende a reivindicar
margens criando ofertas e serviços individuais, sua apólice.
minimizando a rotatividade de clientes Aprendizagem não supervisionada: basicamente é usado
 Negociação de energia - viabiliza o comércio peer-to- contra dados que não possuem rótulos históricos. Ou seja, o
peer entre produtores e consumidores, combinando mais sistema não sabe a “resposta certa” nesse caso. O algoritmo
rapidamente os produtores com os consumidores deve descobrir o que está sendo mostrado e o objetivo é
 Agentes virtuais - capazes de responder às consultas dos explorar os dados e assim encontrar alguma estrutura neles.
consumidores e fornecer assistência instantânea. O aprendizado não supervisionado funciona bem em dados
podendo segmentar automaticamente os consumidores transacionais. Por exemplo, ele pode identificar segmentos
com base no histórico de serviços e fornecer um aviso de clientes com atributos similares que podem, então, ser
antecipado de dívidas incobráveis tratados de modo igualmente similar em campanhas de
 Seleção de fornecedores - pode ajudar os clientes a marketing; ou ele pode encontrar os principais atributos que
escolherem seu revendedor de energia, utilizando suas separam segmentos distintos de clientes. Técnicas populares
preferências como o tipo de geração de energia, quanto incluem mapas auto-organizáveis, mapeamento por
estão dispostos a pagar e seus padrões de consumo. proximidade, agrupamento k-means e decomposição em
valores singulares. Esses algoritmos também são utilizados
A aplicação de ML ao setor elétrico abre uma ampla gama para segmentar tópicos de texto, recomendar itens e
de possibilidades interessantes, impactando profundamente identificar pontos discrepantes nos dados.
toda a indústria. Evidências iniciais sugerem o aprendizado Aprendizagem semi-supervisionada: geralmente é usado
para as mesmas aplicações que o aprendizado
5

supervisionado, porém ele pode usar tanto dados rotulados canceroso ou benigno. Modelos de classificação classificam os
quanto não marcados para o treinamento – normalmente uma dados de entrada em categorias. Aplicações típicas incluem
pequena quantidade de dados rotulados com uma grande imagens médicas, reconhecimento de fala e pontuação de
quantidade de dados não rotulados (pois os dados não crédito. A técnica de classificação deve ser utilizada se seus
rotulados são mais baratos e necessitam de menos esforço dados puderem ser marcados, categorizados ou separados em
para serem adquiridos). Esse tipo de aprendizagem pode ser grupos ou classes específicos. Por exemplo, aplicativos para
usado com métodos como a classificação, regressão e reconhecimento de escrita manual usam classificação para
previsão. O aprendizado semi-supervisionado é muito útil reconhecer letras e números. No processamento de imagens e
quando o custo associado à rotulagem é muito alto para visão computacional, técnicas de reconhecimento de padrões
permitir um processo de treinamento totalmente rotulado. Os não supervisionadas são usadas para detecção de objetos e
primeiros exemplos disso incluem a identificação do rosto de segmentação de imagens.
uma pessoa em uma webcam. Algoritmos comuns para a realização de classificação
Aprendizagem por reforço: essa opção é muitas vezes incluem máquinas de vetores de suporte (SVM), árvores de
usado para a robótica, jogos e navegação. Com o aprendizado decisão reforçadas e ensacadas, k vizinhos mais próximos,
por reforço, o algoritmo descobre por meio de tentativa e erro Naïve Bayes, análise discriminante, regressão logística e redes
quais ações geram as melhores recompensas. Este tipo de neurais. As técnicas de regressão predizem respostas contínuas
aprendizado possui três componentes principais: o agente (o - por exemplo, mudanças na temperatura ou flutuações na
aprendiz ou tomador de decisão), o ambiente (tudo com que demanda de energia. Aplicações típicas incluem previsão de
o agente interage) e ações (o que o agente pode fazer). O carga de eletricidade e negociação algorítmica. Tais técnicas de
objetivo é que o agente escolha ações que maximizem a regressão são utilizadas quando se trabalha com um intervalo
recompensa esperada em um período de tempo determinado. de dados ou se a natureza da resposta for um número real, como
O agente atingirá o objetivo muito mais rápido se seguir uma a temperatura ou o tempo até a falha de um equipamento.
boa política. Então o foco do aprendizado por reforço é
descobrir a melhor política.
B. Aprendizagem Não Supervisionada
Na aprendizagem não supervisionada Clustering é a técnica
de aprendizado mais comum [11]. Ela é usada para análise
exploratória de dados para encontrar padrões ocultos ou
agrupamentos em dados. Aplicações para análise de cluster
incluem análise de sequência genética, pesquisa de mercado e
reconhecimento de objetos. Por exemplo, se uma empresa de
telefonia celular quiser otimizar os locais onde constroem torres
de telefonia celular, eles podem usar o aprendizado de máquina
para estimar o número de grupos de pessoas que dependem de
suas torres. Um telefone só pode falar com uma torre por vez,
então a equipe usa algoritmos de agrupamento para projetar a
melhor colocação de torres de celular para otimizar a recepção
de sinal para grupos ou clusters de seus clientes.
Algoritmos comuns para executar clustering incluem k-
meios e k-medoids, clustering hierárquico, modelos de mistura
gaussiana, modelos ocultos de Markov, mapas de auto-
organização, clustering f-c-means e clustering subtrativo.

IV. CASOS DE APLICAÇÃO


A. Previsão de estabilidade de tensão usando o Aprendizado
Ativo de Máquina
A operação da rede elétrica precisa de novos sistemas de
monitoramento que forneçam cada vez mais medições precisas
sobre o comportamento da rede para o operador [20].
Fig. 2. Técnicas de Machine Learning. A utilização de dados de novos equipamentos de subestações,
A. Aprendizagem Supervisionada como as PMUs, contribui para melhorar a tomada de decisões
A aprendizagem supervisionada usa técnicas de classificação e a operação [21]. Como as medições são geralmente reunidas
e regressão para desenvolver modelos preditivos [11]. As em alta velocidade e volume, torna-se imperativo explorar
técnicas de classificação predizem respostas discretas - por novas metodologias de análises de dados on-line com recursos
exemplo, se um email é genuíno ou spam, ou se um tumor é rápidos de processamento de dados. A abordagem de
aprendizado de máquina tem a capacidade de generalização em
6

que o modelo baseado em dados, se treinado adequadamente, O aprendizado ativo é empregado neste trabalho para lidar
pode fazer previsões precisas a partir de medidas para as quais com as desvantagens mencionadas. A Figura 3 mostra a
não foi exposto anteriormente. diferença entre a abordagem proposta e os algoritmos existentes
Embora os algoritmos de aprendizado de máquina sejam de aprendizado de máquina. A técnica de aprendizagem ativa
excelentes em sua rápida capacidade de tomada de decisão, está construindo iterativamente as bases de conhecimento, que
duas dificuldades técnicas ainda não foram totalmente são otimizadas para tamanho e precisão. Em vez de usar o
resolvidas: método de simulação exaustivo, ele seleciona interativamente
a) como atualizar os modelos de aprendizado de máquina os POs mais representativos ao criar o conjunto de dados de
quando as previsões contradizem as condições reais do sistema; treinamento. Em vez de confiar em simulações inclusivas
b) como preparar eficientemente os dados de treinamento baseadas em um modelo de sistema de energia, a abordagem
para eliminar simulações redundantes de sistemas de energia proposta procura ativamente os POs onde ocorrem previsões
off-line. imprecisas de aprendizado de máquina. Em seguida, ele executa
A estabilidade de tensão em um sistema de transmissão está simulações especiais para criar novos mapeamentos em torno
entre os principais desafios para a operação de uma rede dos POs identificados e os adiciona ao conjunto existente de
elétrica. Para eficiência e benefícios econômicos, os operadores conjunto de dados de treinamento. Isso ajuda a capturar o
de rede tendem a operar a rede perto de seus limites físicos. comportamento do sistema oculto não representado no processo
A capacidade de fornecer suporte à tomada de decisões em de treinamento anteriormente.
tempo real é desejada e pode melhorar muito a estabilidade,
segurança e confiabilidade de um sistema de energia.
A principal contribuição deste trabalho é a adaptação da
metodologia de aprendizagem ativa baseada em coleta de
medições do sistema de potência, como exemplo as
informações da Medição Fasorial Sincronizada dos dados PMU
usados para avaliar a estabilidade de tensão. Avaliando a
incerteza dos modelos de aprendizado de máquina e a carga
computacional de treinamento para previsão de instabilidade de
tensão. Fig. 3. Abordargem proposta versus abordagens existentes.
O desempenho de uma ferramenta de aprendizado de
máquina depende da capacidade do comportamento do sistema Na maioria dos casos, as simulações baseadas na modelagem
conhecido representado pelo conjunto de dados de treinamento. do sistema de potência são usadas para verificar a precisão da
Portanto, as abordagens existentes de aprendizado de máquina previsão e identificar quaisquer contradições entre a previsão
geralmente empregam um método de força bruta para gerar a da aprendizagem da máquina e o comportamento real do
base de conhecimento usando simulações baseadas em modelos sistema. Em alguns casos mais raros, tal contradição pode ser
de sistema físico. Devido à complexidade computacional da observada sem verificação de simulação. Quando o sistema de
grande quantidade de simulações necessárias, uma única base energia monitorado perdeu sua estabilidade de tensão, mas o
de conhecimento inalterada foi usada em muitas aplicações. As indicador de estabilidade de tensão ainda relata uma condição
ferramentas de aprendizado de máquina treinadas dessa estável é um bom exemplo de uma contradição óbvia.
maneira são “passivas” e sofrem de três principais A abordagem proposta também inclui essas contradições
desvantagens quando incorporadas em aplicativos on-line: observadas diretamente no conjunto de treinamento. O objetivo
é minimizar a influência negativa de modelos imprecisos de
 O conjunto de treinamento inicial é formulado em uma componentes do sistema de potência.
determinada condição de operação do sistema físico. Nossa abordagem é geral o suficiente para acomodar os
Quando as atualizações subsequentes não são modelos mais comuns de aprendizado de máquina, que podem
contabilizadas, a ferramenta de aprendizado de máquina funcionar como um classificador probabilístico. A incerteza de
pode falhar à medida que as condições operacionais do um classificador probabilístico é examinada para orientar a
sistema evoluem; criação da base de conhecimento.
 Quando os modelos de aprendizado de máquina são Em nosso trabalho, a abordagem proposta aplicada ao
atualizados, sem reduzir a quantidade de simulações problema de estabilidade de tensão ilustra o potencial de
necessárias, o treinamento baseado no mesmo método melhoria quantificando o desempenho de vários modelos
de simulação de força bruta atrasa muito a retomada do comuns de aprendizado de máquina em termos de tempo de
aplicativo on-line. treinamento, tempo de previsão e precisão. A margem de
 A base de conhecimento é criada exclusivamente com estabilidade de tensão é computada para rotular cada PO como
base no modelo do sistema de energia. Quando a estável ou instável, dado um estado do sistema de transmissão.
fidelidade do modelo do sistema é questionável, a Com o aprendizado ativo baseado em sistema de
precisão da previsão das ferramentas de aprendizado de agrupamento, um conjunto de dados rotulados é criado a partir
máquina é afetada negativamente. de um grande agrupamento de dados não rotulados usando
“Simulação Baseada em Modelagem Detalhada do Sistema”
7

que, com grande custo, produz um rótulo preciso. O termo o valor médio da margem de estabilidade de todos os POs,
“Simulação Baseada em Modelagem Detalhada do Sistema” yi = 2 para POs com uma margem de estabilidade no segundo
refere-se à simulação de estado estacionário ou dinâmica quartil, e yi = 3 se a margem de estabilidade estiver no menor
baseada em um modelo detalhado do sistema de potência. O quartil. O intervalo de VSM foi de 0,1% a 6%, e mais detalhes
conjunto de dados refere-se aos POs gerados pela simulação podem ser encontrados em [6].
baseada no modelo do sistema físico em várias condições Usando o conjunto de dados rotulados, é possível treinar um
operacionais do sistema. No trabalho apresentado, o PO modelo de aprendizado de máquina f, que pode então, para um
rotulado também pode ser o mapeamento conhecido entre PO xj invisível, fornecer uma aproximação da estabilidade de
medições em fluxo e comportamento real do sistema. O modelo tensão.
de aprendizado de máquina é então treinado para aproximar o A tarefa é construir uma base de conhecimento que leve ao
oráculo de uma maneira que minimize o número de consultas aprendizado ideal por PO rotulado. Dado o DU, o objetivo é
ao oráculo. O aprendizado ativo baseado em agrupamentos de encontrar subconjuntos DL incrementalmente maiores em
dados tem sido investigado com frequência em casos tamanho, o que otimamente aumenta a precisão de previsão de
semelhantes em que especialistas humanos fornecem rótulos um modelo de aprendizado de máquina treinado na D L atual.
para dados [22]. Essas abordagens são úteis devido à grande Esse problema imita a situação comum em um sistema de
diferença entre a velocidade com que o operador do sistema energia no qual a geração de POs em DL é computacionalmente
pode fornecer rótulos e a duração da fase de treinamento e cara, enquanto a obtenção de POs para DU é barata.
previsão do modelo de aprendizado de máquina.
Redes Neurais Artificiais
Estabilidade de tensão refere-se à capacidade de um sistema
de potência de manter tensões constantes em todos os A RNA foi treinada para prever um rótulo como uma saída
barramentos no sistema após ter sido sujeito a um distúrbio de contínua. Uma propriedade específica das RNAs usada para
uma dada condição inicial de operação [23]. Neste trabalho, classificação binária é que elas generalizam todo o espaço de
estudou-se a estabilidade de tensão a longo prazo de um sistema entrada, mesmo que apenas poucos POs sejam usados para
de transmissão de energia em resposta a condições de carga de treinamento. Uma boa abordagem heurística para resolver esse
variação lenta. Como mencionado anteriormente, os operadores problema envolve incluir pelo menos um PO de cada classe no
da rede tendem a operar a rede perto de seus limites físicos. conjunto de treinamento. As experiências foram realizadas
Quando esses limites são violados, o sistema pode experimentar usando o MATLAB Neural Network Toolbox.
várias formas de falhas em todo o sistema, incluindo o colapso Máquinas de Vetores de Suporte
de tensão. Durante a implantação de aplicativos que são baseados no
SVM para classificação, novos POs são classificados por este
modelo de acordo com sua similaridade com um conjunto de
POs escolhidos para representar um limite de decisão.
Árvores de Decisão
Em um conjunto como o RF, o número de árvores usadas dita
o número potencial de valores que podem ser obtidos como a
estimativa de probabilidade e é, portanto, mais adequado para
aprendizado ativo do que árvores de decisão pura. Uma porta
do pacote R randomForest foi usada para experimentos.
Aprendizagem Ativa
Ao invés de assumir que para todos os POs xi possuem o yi
Fig. 4. Magnitude da tensão x demanda de carga. apropriado, o conjunto de dados DL é inicialmente assumido
como vazio, ou apenas inicializado com um OP de cada classe.
O conhecimento de domínio pode normalmente ser usados para
A estabilidade de tensão pode ser aproximada calculando a fornecer vários OPs de cada estado de estabilidade para
distância do atual PO. Conforme indicado na Fig. 4, as inicializar o DL, mas esses OPs não podem ser confiáveis para
condições de instabilidade de tensão surgem quando a demanda previsões precisas.
de carga tenta ir além da potência máxima de entrega. Os Adicionar rótulos aos OPs no DU usando o “Simulação
sistemas normais POs estão acima do VCP, ao longo da linha Baseada em Modelagem Detalhada do Sistema” aumenta o
definida pela relação entre demanda e magnitude de tensão tamanho do DL. Esse conjunto pode ser usado para quantificar
correspondente no barramento de carga. Quando o PO se move o aumento na precisão, após cada OP rotulado, tanto para
para um ponto abaixo da VCP, consequências catastróficas amostragem aleatória quanto para aprendizado ativo.
podem ocorrer.
Para a aplicação da estabilidade de tensão em sistemas de Aprendizado Ativo Baseado em Sistema de Agrupamento
transmissão foi considerado um problema de três classes, onde Um agrupamento maior de dados não rotulados que
yi = 1 representa POs com margens de estabilidade maiores que representam as condições de operação do sistema de energia é
8

rotulado iterativamente com um “Simulação Baseada em “críticos” POs rotulados. Um total de 256 canais de dados
Modelagem Detalhada do Sistema” para criar um conjunto de fasoriais simulados foram coletados, abrangendo 1.0147 OP
dados rotulados O modelo de aprendizado de máquina pode ser selecionados.
treinado. A incerteza do modelo de aprendizado de máquina é As seguintes conclusões foram alcançadas:
usada para selecionar pontos de dados para rotulagem pelo
oráculo. Em cada iteração, um classificador parcialmente  Foi identificada que os conjuntos de dados de treinamento
treinado escolhe um exemplo x* do conjunto de dados sem pode ser um ponto fraco, que muitas vezes são
rótulo sobre o qual o classificador é mais incerto. negligenciado na aplicação de problemas de aprendizado
Quando incorporado em aplicativos do sistema de energia de máquina aos sistemas de energia não conseguindo ser
on-line, o conjunto de dados sem rótulo se refere às medições sempre eficientes.
de séries temporais transmitidas para uma instalação central  A abordagem de aprendizagem ativa proposta baseada em
onde reside o modelo de aprendizado de máquina. A técnica agrupamento pode construir conjuntos de dados para um
proposta compara continuamente a previsão do modelo de modelo de aprendizado de máquina para treinar de forma
aprendizado de máquina com o comportamento real do sistema. mais eficiente.
Uma vez que uma contradição é identificada, o PO  A abordagem descrita aprimora os modelos existentes de
correspondente é registrado. O “Simulação Baseada em aprendizado de máquina, identificando os pontos
Modelagem Detalhada do Sistema” é usado para gerar um operacionais nos quais as previsões do modelo
rótulo preciso para o OP através da simulação baseada em contradizem a realidade e adicionando conjuntos de dados
modelo. No trabalho apresentado, o status de estabilidade de rotulados em torno desses pontos à base de conhecimento.
tensão é determinado como um rótulo y * e atribuído ao OP. O  A abordagem também acelera o processo de treinamento
novo OP rotulado agora pode ser incluído no pool de DL, para off-line, reduzindo a quantidade de simulações baseadas
que possa ser usado na próxima iteração de aprendizado. em modelos em torno de outros pontos operacionais, onde
Aprendizado Ativo em Sistemas de Potência previsões corretas foram feitas.
Como discutido anteriormente, no estudo da estabilidade de  A abordagem foi empregada para lidar com a estabilidade
tensão do sistema de transmissão, o VSM é usado como de tensão nos sistemas de transmissão. Desempenho
indicador ou rótulo. Para uma grande rede de energia, pode promissor foi alcançado.
levar horas para criar POs rotulados usando o cálculo de fluxo
de potência no modelo de sistema detalhado construído no B. Detecção de Injeção de Dados Falsos Usando Aprendizado
programa de estabilidade PSSE [6]. de Máquina em SG
A integração da abordagem de aprendizagem ativa proposta De acordo com [22], o crescimento populacional trouxe
nas aplicações do sistema de potência. As medições dos grandes desafios para o setor elétrico. Enfrentar esses desafios
Fasoriais Sincronizadas são transmitidas das PMU para o requer mudanças profundas nos sistemas de energia
agrupamento não rotulado. Neste exemplo, a atividade não tradicionais.
ocorre simultaneamente. A Simulação Baseada em Modelo é O estimador de estado é uma maneira eficiente de
calibrado off-line, os dados no Conjunto sem rótulo podem ser monitoramento on-line dos estados da rede de energia. Para
históricos DT, RF ou SVM. A “Simulação Baseada no Modelo” estimar os estados de uma rede, os valores medidos de potência
é usado para rotular POs, que são então incluídos no Labelled ativa devem ser distribuídos coletivamente para um estimador
Label para o aprendizado. de estado central através de links de comunicação. Geralmente,
Ao fazer previsões sobre o agrupamento sem rótulo, os POs essas medições são coletadas por sensores instalados na
mais incertos são identificados. Os POs recebem então rótulos subestação. Os estados estimados são a base de referência usada
precisos pela “Simulação Baseada no Modelo” e são pelos centros de operação para manter a operação da rede
armazenados no conjunto rotulado para que possam ser usados elétrica em um modo seguro.
para aprendizado posterior. Medições de campo podem ser A infraestrutura de comunicação conecta as subestações aos
centros de operação, porém aumenta os desafios referente a
usadas para verificar e calibrar ferramentas de simulação
segurança cibernética, pois os estimadores de estado são
durante a configuração inicial do sistema.
potencialmente alvos de ataques cibernéticos.
A abordagem proposta é avaliada em experimentos
O trabalho em [23] analisa ataques maliciosos em três
utilizando dados sintéticos obtidos a partir de simulações no categorias diferentes com base nos objetivos de segurança da
modelo detalhado do sistema de potência. Seu desempenho é rede inteligente:
quantificado em termos de previsão e tempo de treinamento e 1. Disponibilidade: Os ataques tentam atrasar, bloquear
precisão de previsão. ou corromper a comunicação na rede inteligente
O experimento se concentra em prever as margens de (também chamada de ataque de negação de serviço).
estabilidade de tensão em uma rede de transmissão. A rede de 2. Integridade: Um invasor tenta interromper ilegalmente
teste é o sistema WECC simplificado, que consiste em 29 a troca de dados.
geradores, 179 ônibus, 263 linhas de transmissão, 42 derivações
3. Confidencialidade: Um invasor tenta obter
e 104 cargas. A base de conhecimento preparada pela
informações não autorizadas de recursos da rede.
“Simulação” inclui 5078 “estáveis”, 2540 “alertas” e 2529
9

Conforme [22], os custos gerais de monitoramento das redes detecção. Esta efetividade é particularmente importante em
inteligente serão reduzidos, mas, ao mesmo tempo, o risco de sistemas SG, devido à sua sensibilidade a atrasos, já que o
ataques cibernéticos serão aumentados. Recentemente, um sistema fica exposto a maiores riscos enquanto as ameaças
novo tipo de ataque, chamado ataque furtivo, foi introduzido. permanecem não detectadas.
Este ataque não pode ser detectado pela detecção tradicional de Pode-se constatar também que as técnicas de ML se mostram
dados incorretos usando estimadores de estado. eficazes na seleção de grandes volumes de dados de SG. Desta
Para detectar tais ataques, os autores propõem o uso de dois forma, informações úteis podem ser extraídas e empregadas em
métodos de Machine Learning. O primeiro método utiliza o diferentes tarefas de planejamento e operação de sistemas
aprendizado supervisionado sobre os dados rotulados e treina elétricos de potência, tais como: identificação de padrões de
uma máquina de vetores de suporte, em inglês support vector
geração e demanda, previsão da demanda a curto prazo, ajuste
machine (SVM). O SVM é um conceito utilizado na ciência da
dos parâmetros de controle, análise da segurança dinâmica de
computação para um conjunto de métodos do aprendizado
grandes áreas, e planejamento da expansão do sistema.
supervisionado que analisam os dados e reconhecem padrões,
sendo também usado para classificação e análise de regressão. Em sistemas SG, cada vez mais interconectados e integrados
Uma grande vantagem no uso de SVM é sua capacidade de tecnologicamente, todos os segmentos (geração, transmissão,
generalização. A capacidade de generalização de um distribuição e comercialização) estão expostos a significativos
classificador é medida por sua eficiência na classificação de riscos de ataques cibernéticos. Muitos ataques desta natureza
dados que não pertençam ao conjunto utilizado em seu foram inclusive já realizados. Portanto, a segurança dos dados
treinamento. é uma grande preocupação das redes inteligentes, sendo as
O segundo método usa o método não supervisionado, ou seja, técnicas de ML bastante contributivas, devido à capacidade de
não existem dados rotulados. O algoritmo baseado em manipularem grande volume de dados não-lineares.
estatística foi utilizado pelo método. O algoritmo aprende a
representar as entradas submetidas segundo uma medida de
qualidade. Desta forma, o algoritmo detecta o desvio nas B. Perspectivas Futuras
medições. Em ambos os métodos, a análise dos componentes Além das questões já apontadas na seção anterior, que devem
principais, em inglês principal component analysis (PCA), é ser aperfeiçoadas ao longo do tempo, tais como a não
usada para reduzir a dimensionalidade dos dados a serem correspondência entre as previsões e as condições atuais dos
processados, o que leva a menores esforços computacionais. sistemas, e a eliminação de simulações off-line redundantes,
Segundo os autores de [22], os resultados obtidos mostram a outras questões emergem. Um ponto que deverá ser
eficácia dos algoritmos propostos para a detecção da injeção aperfeiçoado são as garantias teóricas sobre a melhoria de
furtiva de dados falsos. desempenho dos algoritmos de ML, em termos de precisão e do
número de pontos de operação que precisam ser simulados.
V. DISCUSSÃO Outro ponto que certamente será melhorado são as estimativas
A partir de todo conteúdo abordado, podem ser empreendidas de incerteza dos modelos de ML, que invariavelmente são
algumas constatações sobre os pontos mais relevantes ao afetas por dados intencionalmente falsos, o que prejudica a
escopo do trabalho. Na sequência, tais constatações são precisão das previsões obtidas.
apresentadas e discutidas, sendo subdivididas em duas Pode-se verificar uma tendência de crescimento no uso de
categorias: aplicações baseadas em técnicas de ML, já que elas possibilitam
soluções promissoras no campo da defesa a vulnerabilidades
 Smart Grid e Machine Learning: estado atual e; cibernéticas, questão que ganha importância com os sistemas
 Perspectivas futuras. SG. Esta tendência se deve ao ecletismo das técnicas de ML que
podem ser aplicadas à maioria das tarefas de manipulação de
dados, tais como: classificação, detecção, identificação,
A. Smart Grid e Machine Learning: Estado Atual regressão e previsão.
Enquanto os algoritmos de ML se destacam pela capacidade Especificamente uma tarefa que deve ter ganhos de
de tomarem rápidas decisões, pode-se verificar que duas desempenho com o emprego das técnicas de ML é a previsão
dificuldades técnicas não foram ainda totalmente resolvidas: de carga nas redes elétricas inteligentes. O reconhecimento do
uso irregular de padrões de energia em edifícios, por exemplo,
 Como atualizar os modelos de ML quando as previsões pode ser obtido pela detecção de outliers (valores anormais) e
não correspondem às condições atuais do sistema de por uma análise de agrupamento. Uma análise de correlação
potência; pode também ser realizada para verificar-se o grau de aderência
 Como preparar eficientemente os dados de treinamento entre variáveis climáticas e o consumo de energia.
para eliminar simulações off-line redundantes.
VI. CONCLUSÃO
Para a detecção de dados falsos injetados em sistemas SG Os sistemas elétricos de potência têm passado por um
complexos e com grande volume de medições, os métodos processo de transição energética e tecnológica irrevogável, que
tradicionais são pouco eficientes. Já as técnicas de ML possuem o levará a um outro paradigma em termos de planejamento e
recursos de análise não-linear que se mostram efetivos na operação. Energeticamente, a mudança ocorre em função do
10

aumento da participação de fontes renováveis nas matrizes [12] P. Iona et al. (2011). Making Smart Grids Smarter by Using Machine
Learning. Proceedings of the Universities Power Engineering
energéticas dos países. Devido à sua característica intermitente Conference. 2011. 1-5
e distribuída, tais fontes aumentam o grau de incerteza em todos https://www.researchgate.net/publication/258977475
os segmentos do setor elétrico. Tecnologicamente, a [13] H. Xu, H. Huang, R. S. Khalid and H. Yu, "Distributed machine
possibilidade de medições remotas, sincronizadas e com alta learning based smart-grid energy management with occupant
taxa de amostragem, aliada à comunicação bidirecional em cognition," 2016 IEEE International Conference on Smart Grid
Communications (SmartGridComm), Sydney, NSW, 2016, pp. 491-
tempo real, ou quase real, tem impulsionado o desenvolvimento 496 10.1109/SmartGridComm.2016.7778809
de novas aplicações no contexto dos sistemas SG. [14] J. Carbonell, R. Michalski, T. Mitchell, " Machine Learning:A
Neste cenário, toda esta transição tem despertado Historical and Methodological Analysis," AI Magazine, V.4 1983.
preocupações com a segurança cibernética dos dados, que doi: NO0014-79-C-0661
ganham volume e importância em redes elétricas inteligentes. [15] R. Nawaz, M. A. Shahid, I. M. Qureshi and M. H. Mehmood,
Por outro lado, estas mudanças também têm aberto a "Machine learning based false data injection in smart grid," 2018 1st
International Conference on Power, Energy and Smart Grid
possibilidade de emprego de novas técnicas matemáticas e (ICPESG), Mirpur Azad Kashmir, 2018, pp. 1-6. doi:
computacionais, efetivas não somente no combate de ameaças 10.1109/ICPESG.2018.8384510
cibernéticas, mas também no planejamento e na operação dos [16] A. Bagheri, M. H. J. Bollen and I. Y. H. Gu, "Big data from smart
sistemas de potência. As técnicas de ML se enquadram neste grids," 2017 IEEE PES Innovative Smart Grid Technologies
Conference Europe (ISGT-Europe), Torino, 2017, pp. 1-5. doi:
contexto, sendo bastante promissoras como ferramentas
10.1109/ISGTEurope.2017.8260155
efetivas para a solução dos diversos problemas detalhados ao
[17] A. Almalaq and G. Edwards, "A Review of Deep Learning Methods
longo deste trabalho. Applied on Load Forecasting," 2017 16th IEEE International
Conference on Machine Learning and Applications (ICMLA),
Cancun, 2017, pp. 511-516. doi: 10.1109/ICMLA.2017.0-110
REFERÊNCIAS BIBLIOGRÁFICAS [18] C. Dong et al., "Forecasting Smart Meter Energy Usage Using
Distributed Systems and Machine Learning," 2018 IEEE 20th
International Conference on High Performance Computing and
[1] E. Hossain, I. Khan, F. Un-noor, S. S. Sikander, and S. H. Sunny, Communications; IEEE 16th International Conference on Smart City;
“Application of Big Data and Machine Learning in Smart Grid , and IEEE 4th International Conference on Data Science and Systems
Associated Security Concerns : A Review,” IEEE Access, vol. 7, pp. (HPCC/SmartCity/DSS), Exeter, United Kingdom, 2018, pp. 1293-
13960–13988, 2019. 1298. doi: 10.1109/HPCC/SmartCity/DSS.2018.00216
[2] F. Pallonetto, M. De Rosa, F. Milano, and D. P. Finn, “Demand [19] H. Yang, P. Li, A. Masood, Y. Xiao, B. Sheng and Q. Yu, "Smart
response algorithms for smart-grid ready residential buildings using grid data analysis and prediction modeling," 2016 International
machine learning models,” Appl. Energy, vol. 239, no. January, pp. Conference on Progress in Informatics and Computing (PIC),
1265–1282, 2019. Shanghai, 2016, pp. 541-544. doi: 10.1109/PIC.2016.7949559
[3] K. A. P. da Costa, J. P. Papa, C. O. Lisboa, R. Munoz, and V. H. C. [20] T. Hong et al., “Guest editorial big data analytics for grid
de Albuquerque, “Internet of Things: A survey on machine learning- modernization,” IEEE Trans. Smart Grid, vol. 7, no. 5, pp. 2395–
based intrusion detection approaches,” Comput. Networks, vol. 151, 2396, Sep. 2016.
pp. 147–157, 2019.
[21] B. Wang, B. Fang, Y. Wang, H. Liu, and Y. Liu, “Power system
[4] Y. T. Quek, W. L. Woo, and T. Logenthiran, “Smart Sensing of Loads transient stability assessment based on big data and the core vector
in an Extra Low Voltage DC Pico-Grid Using Machine Learning machine,” IEEE Trans. Smart Grid, vol. 7, no. 5, pp. 2561–2570, Sep.
Techniques,” IEEE Sens. J., vol. 17, no. 23, pp. 7775–7783, 2017. 2016.
[5] T. Ahmad and H. Chen, “Potential of three variant machine-learning [22] M. Esmalifalak, L. Liu, N. Nguyen, R. Zheng, Z. Han, Detecting
models for forecasting district level medium-term and long-term Stealthy False Data Injection Using Machine Learning in Smart Grid,
energy demand in smart grid environment,” Energy, vol. 160, pp. IEEE Syst. J. 11 (2017) 1644–1652.
1008–1020, 2018. doi:10.1109/JSYST.2014.2341597.
[6] V. Malbasa, C. Zheng, P. C. Chen, T. Popovic, and M. Kezunovic, [23] W. Wang, Z. Lu, Cyber security in the Smart Grid: Survey and
“Voltage Stability Prediction Using Active Machine Learning,” IEEE challenges, Comput. Networks. 57 (2013) 1344–1371.
Trans. Smart Grid, vol. 8, no. 6, pp. 3117–3124, 2017. doi:10.1016/j.comnet.2012.12.017.
[7] S. Breker, J. Rentmeister, B. Sick, and M. Braun, “Hosting capacity
of low-voltage grids for distributed generation: Classification by
means of machine learning techniques,” Appl. Soft Comput. J., vol.
70, pp. 195–207, 2018.
[8] M. Esmalifalak, S. Member, L. Liu, and S. Member, “Detecting
Stealthy False Data Injection Using Machine Learning in Smart
Grid,” vol. 11, no. 3, pp. 1644–1652, 2017.
[9] F.C. Pereira, S.S. Borysov. “Mobility Patterns, Big Data and
Transport Analytics,” C. Antoniou, L. Dimitriou, F. Pereira, Elsevier,
2019, pp.9-29. https://doi.org/10.1016/B978-0-12-812970-8.00002-
6.
[10] R. Boutaba et al. “A comprehensive survey on machine learning for
networking: evolution, applications and research opportunities,”,
Journal of Internet Services and Applications, 2018, pp.9-16.
https://doi.org/10.1186/s13174-018-0087-2.
[11] G, Shobha, S. Rangaswamy. “Handbook of Statistics – Machine
Learning,” V. Gudivada, C.R. Rao, Elsevier, 2018, pp.197-228.
https://doi.org/10.1016/bs.host.2018.07.004.

Anda mungkin juga menyukai